انجمن‌های فارسی اوبونتو

لطفاً به انجمن‌ها وارد شده و یا جهت ورود ثبت‌نام نمائید

لطفاً جهت ورود نام کاربری و رمز عبورتان را وارد نمائید

نویسنده موضوع: پروژه OCR فارسی آزاد  (دفعات بازدید: 405 بار)

0 کاربر و 1 مهمان درحال مشاهده موضوع.

آفلاین Supreme Sailor

  • Full Member
  • *
  • ارسال: 128
پروژه OCR فارسی آزاد
« : 26 خرداد 1401، 09:22 ب‌ظ »
سلام به همگی.

من محمدرضا حقیری هستم، یک برنامه‌نویس ۲۷ ساله (تازه وارد ۲۷ شدم البته) و خب خیلی‌هاتون من رو از زمان قدیم و بخصوص پروژه جبیر می‌شناسید احتمالا. احتمالش وجود داره که من رو از توییتر، رویدادهای حول نرم‌افزار آزاد و ... بشناسید. و خب احتمالش هم هست که اصلا نشناسید 😁 در هر صورت، از این که در جمع حضور دارم و به نوعی فعال و توسعه‌دهنده نرم‌افزار آزاد محسوب میشم خوشحال و خرسندم.

از معرفی خودم که بگذرم، میخوام در مورد این پروژه کمی روده‌درازی کنم و توضیح بدم که این پروژه چیه و چرا ایجادش کردم. خب، یکی از دلایلی که ما اینجاییم (دقت کنید که الزامی هم نیست که دلیل اینجا بودنتون این باشه) اینه که ما عاشقان آزادی هستیم. ما نرم‌افزار آزاد رو شنیدیم، استفاده کردیم و درکش کردیم. پارسال بود که من پروژه پلاک‌خوان رو شروع کردم. این پروژه به نوعی یک OCR خیلی ساده به حساب میومد که می‌تونست عددهایی که با یک تایپ‌فیس خاص نوشته شدند رو بفهمه و به ما بگه که چی هستند.

راستش، من مدتها بود که هدفی در ذهن داشتم. این که یک محصول بزرگ بینایی ماشین توسعه بدم، در عین حال از آغاز امسال (یعنی ۱۴۰۱ هجری خورشیدی) به سرم زد که یک پروژه آزاد بزرگ هم داشته باشم. از اونجایی که با یک دست نمی‌شود بیش از یک هندونه بلند کرد، تصمیم گرفتم جفتش یکی باشه. یک پروژه پردازش تصویر آزاد! نتیجه این شد که بعد چند ماه فکر کردن به این نتیجه رسیدم که OCR فارسی آزاد رو توسعه بدم.

پروژه OCR فارسی آزاد

اولین سوالی که در ذهن شما ایجاد میشه احتمالا اینه که OCR چیه؟ خب توضیح ساده‌ست. OCR یا تشخیص نویسه نوری (که البته بهش نویسه‌خوان نوری هم میگن) فرایندیه که طی اون، نوشته‌های درون یک عکس رو میشه خوند. مثلا همون پلاک‌خوان (البته مثال ملموس‌ترش در نرم‌افزارهای غیرآزاد Google Lensئه). حالا چرا دارم این نمونه آزاد رو توسعه میدم؟ دلیلش واضحه. چون OCR فارسی خوب نداریم :)


تصویر بالا، نمونه‌ای از خروجی این نرم‌افزاره که فعلا در فاز آزمایشگاهیش قرار گرفته. این نرم‌افزار، تحت پروانه GPL-3 منتشر میشه و خب من تضمین می‌کنم تا وقتی من مسولیتش رو بر عهده دارم همین پروانه بمونه. اگر چنانچه روزی این پروژه دست شخص/شرکت دیگری بود، باز هم تلاش می‌کنم تا آزاد بمونه.

به‌روزرسانی به تاریخ ۳۱ خرداد ۱۴۰۱:
کار بر روی تشخیص حروف فارسی هم تمام شد و این نتیجه‌ش:

کدها در گیتهاب: https://github.com/prp-e/persian_ocr_project

منتظر نظرات و پرسش‌ها و بازخوردهای شما عزیزان هستم.
« آخرین ویرایش: 31 خرداد 1401، 09:52 ب‌ظ توسط Supreme Sailor »

آفلاین Mehr32

  • High Hero Member
  • *
  • ارسال: 3783
  • جنسیت : پسر
  • عصبی انجمن !
پاسخ : پروژه OCR فارسی آزاد
« پاسخ #1 : 26 خرداد 1401، 09:32 ب‌ظ »
خیلی عالیه جناب حقیری خیلی !
چه کمکی از دستمون بر میاد ؟ احتمالا پایگاه اطلاعات برای تصاویر داره درسته ؟ برای تکمیلش کمکی از دست ما برمیاد ؟ (گرفتن تصاویر یا جدا جدا کردن حروف )
پیامبر اکرم :«هرکس از ما کمکی بخواهد ما به او کمک میکنیم,ولی اگر کسی دست نیاز پیش دیگران دراز نکند, خداوند او را بی نیاز خواهد ساخت»

آفلاین Supreme Sailor

  • Full Member
  • *
  • ارسال: 128
پاسخ : پروژه OCR فارسی آزاد
« پاسخ #2 : 30 خرداد 1401، 11:22 ق‌ظ »
خیلی عالیه جناب حقیری خیلی !
چه کمکی از دستمون بر میاد ؟ احتمالا پایگاه اطلاعات برای تصاویر داره درسته ؟ برای تکمیلش کمکی از دست ما برمیاد ؟ (گرفتن تصاویر یا جدا جدا کردن حروف )

سلام.
ببینید یک مرحله آزمایشگاهی/آزمایشی باید بره جلو (که الان در اون مراحلیم) و خب اینجا مشخص میشه چقدر مدل ما بهینه‌ست و چطور کار می‌کنه و ... .
بعدش یه مرحله محصولی داریم که در اون مرحله، نیازمند یاری سبز دوستانم 😁

آفلاین Mehr32

  • High Hero Member
  • *
  • ارسال: 3783
  • جنسیت : پسر
  • عصبی انجمن !
پاسخ : پروژه OCR فارسی آزاد
« پاسخ #3 : 30 خرداد 1401، 11:35 ق‌ظ »
در خدمتم !
پیامبر اکرم :«هرکس از ما کمکی بخواهد ما به او کمک میکنیم,ولی اگر کسی دست نیاز پیش دیگران دراز نکند, خداوند او را بی نیاز خواهد ساخت»

آفلاین ɴɪᴍᴀꜰᴀɴɴɪᴀꜱʟ

  • High Sr. Member
  • *
  • ارسال: 582
  • جنسیت : پسر
  • یه برنامه نویس ۱۱ ساله :)
    • smartnima Website
پاسخ : پروژه OCR فارسی آزاد
« پاسخ #4 : 30 خرداد 1401، 11:43 ق‌ظ »
عالیه! البته خود Google Lens تا حدی از فارسی پشتیبانی میکنه ولی آزاد نیست :)
پیشنهاد میکنم بعد از کامل شدن پروژه یه محیط گرافیکی براش با کیوی نوشته بشه و برای اندروید هم کامپایل شه : )

😎😎  GNU/Linux Is Awesome


آفلاین Supreme Sailor

  • Full Member
  • *
  • ارسال: 128
پاسخ : پروژه OCR فارسی آزاد
« پاسخ #5 : 30 خرداد 1401، 12:00 ب‌ظ »
عالیه! البته خود Google Lens تا حدی از فارسی پشتیبانی میکنه ولی آزاد نیست :)
پیشنهاد میکنم بعد از کامل شدن پروژه یه محیط گرافیکی براش با کیوی نوشته بشه و برای اندروید هم کامپایل شه : )

بحث گوگل‌لنز رو حالا کاری نداریم (چون خودت هم اشاره کردی که آزاد نیست و این دقیقا همون دلیلیه که من این پروژه رو شروع کردم) اما در مورد اندروید حرف زیاده. چندتا چیز باید سنجیده شه و بعد براش اپ‌های موبایل و دسکتاپ نوشته شه. فعلا ترجیح اصلی خودم وب‌سرویس و نرم‌افزار تحت ترمیناله (شاید هم کتابخونه پایتون)

آفلاین ali-n

  • High Hero Member
  • *
  • ارسال: 1297
  • جنسیت : پسر
  • تاریخ..
پاسخ : پروژه OCR فارسی آزاد
« پاسخ #6 : 30 خرداد 1401، 06:43 ب‌ظ »
وای این عالیههه(: دمتون گرممم، بعدش میشه کارهای خیلی زیادی باهاش کرد :) موفق باشید

آفلاین Supreme Sailor

  • Full Member
  • *
  • ارسال: 128
پاسخ : پروژه OCR فارسی آزاد
« پاسخ #7 : 31 خرداد 1401، 09:53 ب‌ظ »
پست نخست به‌روز شد و نماگرفت از نتیجه تشخیص حروف، قرار داده شد.

آفلاین Mehr32

  • High Hero Member
  • *
  • ارسال: 3783
  • جنسیت : پسر
  • عصبی انجمن !
پاسخ : پروژه OCR فارسی آزاد
« پاسخ #8 : 01 تیر 1401، 10:59 ق‌ظ »
تا الان دقتش چقدره ؟ مصلا تصویریک برگه کاغذ که دست نویس باشه هنوز می تونه تشخیص بده ؟
یک فکری با خط من تمرینش بدید بعد میتونه هر خطی رو بخونه  :P خط من رو خودم نمیتونم بخونم !
پیامبر اکرم :«هرکس از ما کمکی بخواهد ما به او کمک میکنیم,ولی اگر کسی دست نیاز پیش دیگران دراز نکند, خداوند او را بی نیاز خواهد ساخت»

آفلاین Supreme Sailor

  • Full Member
  • *
  • ارسال: 128
پاسخ : پروژه OCR فارسی آزاد
« پاسخ #9 : 01 تیر 1401، 05:08 ب‌ظ »
تا الان دقتش چقدره ؟ مصلا تصویریک برگه کاغذ که دست نویس باشه هنوز می تونه تشخیص بده ؟
یک فکری با خط من تمرینش بدید بعد میتونه هر خطی رو بخونه  :P خط من رو خودم نمیتونم بخونم !

فعلا روی داده دستنویس آموزش نشده.

آفلاین Supreme Sailor

  • Full Member
  • *
  • ارسال: 128
پاسخ : پروژه OCR فارسی آزاد
« پاسخ #10 : 02 تیر 1401، 08:47 ب‌ظ »
دوستان عزیز با کمک این دفترچه‌یادداشت ژوپیتر می‌تونید مدل‌ها و ... رو تست کنید.
لطفا اگر ارور و داستانی دریافت می‌کنید، ارور رو دقیق بذارید تا بررسی بشه. چه اینجا چه در ایشوهای گیت‌هاب.

آفلاین Supreme Sailor

  • Full Member
  • *
  • ارسال: 128
پاسخ : پروژه OCR فارسی آزاد
« پاسخ #11 : 03 تیر 1401، 08:37 ب‌ظ »
دوستان عزیزم در حال حاضر در حال تدوین یک پست بلاگ پیرامون این پروژه هستم. به نظرتون چه چیزایی رو پوشش بدم تو پست بلاگم؟

آفلاین Mehr32

  • High Hero Member
  • *
  • ارسال: 3783
  • جنسیت : پسر
  • عصبی انجمن !
پاسخ : پروژه OCR فارسی آزاد
« پاسخ #12 : 03 تیر 1401، 09:00 ب‌ظ »
کاربرد هایی که میتونه توی زندگی داشته باشه
کاربرد های تخصصی تر یا حتی صنعتی
مشکلاتی که میتونه حل کنه
فواید ازاد بودن این پروژه
پیامبر اکرم :«هرکس از ما کمکی بخواهد ما به او کمک میکنیم,ولی اگر کسی دست نیاز پیش دیگران دراز نکند, خداوند او را بی نیاز خواهد ساخت»

آفلاین Mehr32

  • High Hero Member
  • *
  • ارسال: 3783
  • جنسیت : پسر
  • عصبی انجمن !
پاسخ : پروژه OCR فارسی آزاد
« پاسخ #13 : 03 تیر 1401، 09:03 ب‌ظ »
دوستان عزیز با کمک این دفترچه‌یادداشت ژوپیتر می‌تونید مدل‌ها و ... رو تست کنید.
لطفا اگر ارور و داستانی دریافت می‌کنید، ارور رو دقیق بذارید تا بررسی بشه. چه اینجا چه در ایشوهای گیت‌هاب.
Unable to render code block
گیتهاب دفترچه خطا میده
پیامبر اکرم :«هرکس از ما کمکی بخواهد ما به او کمک میکنیم,ولی اگر کسی دست نیاز پیش دیگران دراز نکند, خداوند او را بی نیاز خواهد ساخت»

آفلاین Supreme Sailor

  • Full Member
  • *
  • ارسال: 128
پاسخ : پروژه OCR فارسی آزاد
« پاسخ #14 : 04 تیر 1401، 09:31 ق‌ظ »
دوستان عزیز با کمک این دفترچه‌یادداشت ژوپیتر می‌تونید مدل‌ها و ... رو تست کنید.
لطفا اگر ارور و داستانی دریافت می‌کنید، ارور رو دقیق بذارید تا بررسی بشه. چه اینجا چه در ایشوهای گیت‌هاب.
Unable to render code block
گیتهاب دفترچه خطا میده

دفترچه‌های ژوپیتر روی گیتهاب یکم سخت لود میشن. اگر clone بگیری به نظرم بهتره.