بالبداية سنتعرف معكم على خاصية التعرف الضوئي على الحروف OCR ، وهي عبارة عن آلية تسمح باستخراج البيانات والجداول وإعادة توجيهها من الأوراق التي تم مسحها ضوئيا أو صور الكاميرا او ملفات PDF الى صيغة منظمة وقابلة للتعديل. OCR تقوم باستخراج جميع الحروف الموجودة في الصور ويحولها إلى كلمات و بالتالي يجمع الكلمات الى جمل و الأمر الذي يوصلنا بالنهاية من تحويل الصورة لنص كامل. هذا الأمر ينهي معانتنا مع إدخال البيانات يدويا.
نظام وتقنية التعرف البصري على الحروف تعمل على تحويل جميع الملفات والمستندات المادية والمطبوعة أو أي النص المكتوب الى نص كامل يمكنك قراءته عبر مجموعة اجهزة وبرامج، حيث يتم نسخ النص text الموجود او قراءة هذا النص عبر اجهزة مثل لوحة الدوائر المخصصة والماسح الضوئبي وغيرها ويمكن أن نقوم بمعالجته بشكل إضافي.
موقع و برنامج التعرف الضوئي على النصوص OCR
الذكاء الاصطناعي AI من الممكن استخدامه في برامج التعرف الضوئي على النصوص Optical character recognition (OCR)، وهو الأمر الذي يوصلنا الى ICR وهي برامج أكثر تعقيدا وذكاء، مثل تمييز اللغات المختلفة وطرق الكتابة اليدوية المختلفة والتي يصعب التعرف عليها بالكثير من التقنيات، ويوجد الآن العديد من البرمجيات التي تقدم هذه الخدمات أيضا بشكل مجاني ودقيق جدا وهنا سنعرض لكم موقع AlgoDocs .
AlgoDocs هو موقع الكتروني على الإنترنت يستخدم تقنية التعلم العميق و خوارزميات الذكاء الاصطناعي تم تطويرها لاستخراج النصوص المطبوعة و الجداول وكذلك النصوص المكتوبة بخط اليد من كافة الملفات المقروءة بالماسح الضوئي او الكاميرات كملفات الـ PDF و الصور ويتميز الموقع بالسرعة في استخراج البيانات و محاكاة مستوى الانسان وكذلك هو قادرًا على معالجة الصور القديمة أو ذات الجودة المتدنية و بعد استخراج البيانات يمكن حفظها بصيغ قابلة للتعديل كملفات الاكسل.
AlgoDocs يوفر نسخة مجانية للابد تسمح باستخراج البيانات و الجداول من خمسين صفحة تجدد مجانا كل شهر. وكذلك اذا كنت تحتاج الى معالجة عدد اكبر من الصفحات تتوفر مجموعة من الباقات منخفضة السعر.
تعرف ايضا على طريقة استخراج النصوص من الصور،
فوائد التعرف الضوئي على الحروف (تقنية OCR):
عندما نقوم بتصوير او قراءة ملف باستخدام الماسح الضوئي فان الكمبيوتر يقوم بحفظ وتخزين البيانات على شكل صورة، الأمر لا يسمح لنا بالتعديل او البحث عن بيانات معينة او حتى نسخ جزء معين. الامر يزداد صعوبة إذا حاولنا نسخ الجداول.
من أهم الفوائد لتقنية OCR هي بالتأكيد توفير الوقت والجهد وايضا وبكل تأكيد البعد عن الأخطاء التي من الممكن أن تحصل لو تم العمل بشكل يدوي، وأيضا تسمح لك هذه التقنية تحويل الملفات والمستندات الى ملفات مضغوطة او يمكن ضغطها عند الحاجة الى ذلك.
وباستخدام تقنية التعرف الضوئي على الحروف OCR لا ننسى أنه بإمكانك حفظ وتخزين ملفات تم مسحها ضوئيا وتحويلها لملفات يمكن قراءتها لتكون قابلة للتحرير ، حيث يمكن فتحها على محرر نصوص وبأي شكل تريده والبحث فيه وإتاحته على الانترنت.
كذلك التعرف الضوئي على الأحرف OCR أداة ذكية فعملها لا يتوقف على لغة واحدة فهي تتعرف على جميع اللغات باختلافها، عند ربطها وذلك الأمر يتيح لنا استخراج النصوص بلغات مختلفة ومن ثم ترجمها وبالتالي يسهل أو قد يلغي مهمة الترجمة اليدوية التي قد تستغرق وقت وجهد.
AlgoDocs يسمح لنا باستخراج النصوص و الجداول المضمنة وكتابة خط اليد من المستندات الممسوحة ضوئيًا و كذلك الصور ذات الجودة المنخفضة. حيث انه يوفر محرك OCR يستخرج البيانات بدقة عالية بحيث يمكن معالجة الصور ذات الدقة المنخفضة جدا (dpi as 75). الصورة التالية لعينة ممسوحة ضوئيًا بجودة منخفضة (أبيض وأسود).
والصورة التالية تبين الجدول المستخرج بواسطة AlgoDocs
صورة (2) الجدول المستخرج بواسطة AlgoDocs للتعرف الضوئي على الحروف
المثال الثاني:
صورة (3) عينة أخرى لصورة ممسوحة ضوئيًا بجودة منخفضة
الجدول المستخرج بواسطة AlgoDocs
صورة (4) الجدول المستخرج عن طريق AlgoDocs للتعرف الضوئي على الحروف
كما ترى وكما وضحنا لك فإن دقة AlgoDocs مثالية حتى مع عمليات المسح منخفضة الجودة.
ما هي خطوات استخراج الجداول من المستندات باستخدام AlgoDocs؟
- قم بتحميل نموذج ( ملف يحتوي البيانات التي سيتم استخراجها).
- أضف قاعدة استخراج عن طريق تحديد "الجدول" كنوع البيانات في محرر القواعد.
- سيظهر لك الجدول المستخرج ويمكنك تحديد وتحريك فواصل الأعمدة لاختيار الاعمدة التي ترغب باستخراجها من الجدول.
- انقر فوق الزر "استخراج" لاستخراج الجدول كما يمكنك تطبيق العديد من عوامل التصفية لتحسين الجدول المستخرج وتحويله إلى التنسيق الذي نريده. على سبيل المثال لا الحصر يمكنك تغير تسمية الاعمدة وكذلك دمج الصفوف.
- الخطوة الأخيرة هي تصدير الجداول المستخرجة إلى أحد الصيغ المدعومة ك Excel أو JSON.
ما هي مميزات AlgoDocs للتعرف الضوئي على الحروف OCR باختصار :
- يمكننا استخراج البيانات الغير مهيكلة وتخزينها على شكل جداول وبيانات مهيكلة بحيث يسهل تنظيمها وإجراء التعديل كحذف، إضافة، تخزنيها بأكثر من نوع من الملفات مثل ملفات الإكسل.
- نسخ الجداول المعقدة والممتدة على أكثر من صفحة.
- استخراج وتحويل الجداول والنصوص المكتوبة بخط اليد إلى ملفات إلكترونية.
- استغلال وقت المُوظفين بمهام مفيدة أكثر للشركة بدلًا من قضائهم وقت في استخراج البيانات يدويا.
- سرعة استخراج البيانات بحيث يستطيع معالجة 20 صفحة في الثانية.
- التخلص من الأخطاء اليدوية التي قد ترتكب اثناء النقل والنسخ اليدوي للبيانات.
لا تتردد في تجربة الاشتراك المجاني من AlgoDocs بحيث يمكنك استخراج الجداول والنصوص من أي مستند ممسوح ضوئيًا ك PDFs والصور وكذلك استخراج النصوص المكتوبة بخط اليد وحفضها بأحد مئات الصيغ المدعومة ك Excel أو JSON او تصديرها مباشرة الى البرامج والأنظمة و الأدوات الأخرى كالأنظمة المحاسبية، و أهم 3 مصادر لتحويل JPG إلى Word.