پروژه ای در رابطه با سوپر رزولوشن تصاویر متن هست. اگر کسی مسلط به OCR هست نیاز به کمک دارم. زبان انجام پروژه پایتون می باشد.
پروژه سوپر رزولوشن تصاویر متن با روش سایرن قرار هست انجام بشه. متریک های RMSE، PSNR،SSIM،OCR accuracy ارزیابی بشن.
فقط میخوام به صورت منطقی جمع بشه و نتیجه در اولویت نیست!
لینک مقاله سایرن(نوآوری) رو در پایین قرار میدم.
https://arxiv.org/pdf/2006.09661
لینک مقاله پایه
https://drive.google.com/file/d/1ujEX9uCDkoMyYkocwupUbmrc27MKQg-9/view?usp=drive_link
لینک دیتاست هم در لینک پایین آوردم
https://github.com/piclem/ICDAR2015-TextSR/blob/master/ICDAR2015-TextSR-dataset.zip?raw=true
دیتا ست موجود حجم کمی داره برای آموزش، که برای برطرف کردن این موضوع، یک روش این هست که دیتاست های موجود در حوزه تصاویر متن جمع آوری باید بشن مثل TextZoom و یا هر دیتاست جدید دیگه در حوزه تصاویر متن. بعد روی شبکه سایرن آموزش داده بشن
روش دوم این هست که یک شبکه Encoder Decoder برای pre-train پیدا کنم و آموزش بدم
روش سوم این هست که دیتا رو خودم تولید کنم با کتابخونه Pango برای تولید دیتای متنوع و بعد آموزش بدم.