راهنمای جامع استخراج داده از تصاویر

روش‌های استخراج داده از تصاویر

استخراج داده از تصاویر و انتقال دستی آن به یک فایل گوگل شیت میتواند زمان‌بر و پر از اشتباهات تایپی باشد.

خوشبختانه، با استفاده از ابزار Optical Character Recognition (OCR) در گوگل درایو، میتوانید این اطلاعات را در چند مرحله ساده به صفحه گسترده خود منتقل کنید. در اینجا نحوه انجام آن را شرح میدهیم.

نکات مهم قبل از شروع

قبل از شروع تبدیل متن موجود در تصویر به داده در Google Sheets، به این نکات توجه کنید تا فرآیند به درستی انجام شود:

کیفیت تصویر را بررسی کنید: هر چه کیفیت تصویر بهتر باشد، تبدیل بهتری انجام میشود. اگر تصویر شما یک اسکرین‌شات است، نباید مشکل چندانی وجود داشته باشد. با این حال، اگر با تلفن یا دوربین خود عکس میگیرید، مطمئن شوید که نور کافی وجود دارد و سایه‌ها مانع دید نشوند. همچنین، سعی کنید دستتان ثابت باشد تا از تار شدن تصویر جلوگیری کنید.

از تصاویر با متن با وضوح بالا استفاده کنید: ارتفاع داده‌های موجود در تصویر باید حداقل 10 پیکسل باشد.

مطمئن شوید که فرمت تصویر صحیح است: این فرآیند با فایل‌های JPEG، PNG، TIFF و GIF کار میکند. اگر تصویر شما یکی از این فرمت‌های فایل تصویری نیست، ابتدا آن را تبدیل کنید.

از تصاویر خیلی بزرگ استفاده نکنید: گوگل توصیه میکند که اندازه فایل 2 مگابایت یا کمتر باشد.

بهترین فونت‌ها، فونت‌های استاندارد هستند: اگر متن یا داده‌های عددی موجود در تصویر دارای فونت غیرمعمول باشند، تبدیل ممکن است به خوبی که انتظار دارید کار نکند.

ممکن است قالب‌بندی حفظ نشود: پس از اتمام تبدیل، برای ایجاد تغییرات دستی در قالب‌بندی داده‌ها آماده باشید.

به یک حساب Google نیاز دارید: برای استفاده از این ابزار تبدیل OCR، باید وارد حساب Google خود شوید.

همچنین میتوانید مراحل موجود در این راهنما را برای تبدیل متن و اعداد موجود در فایل‌های PDF اسکن‌شده به داده در Google Sheets دنبال کنید.

مرحله 1: آپلود تصویر در Google Drive

فرض کنید این تصویر را دانلود کرده‌اید—یک اسکرین‌شات از یک PDF حاوی نام‌ها و آدرس‌های مختلف در فرمت PNG—و میخواهید داده‌ها را استخراج و در Google Sheets ویرایش کنید.

برای دانلود رایگان یک کپی از این تصویر PNG، روی لینک کلیک کنید. پس از کلیک روی لینک، دکمه دانلود را در گوشه بالا سمت راست صفحه مشاهده خواهید کرد.

از آنجا که فایل یک تصویر PNG است، نمیتوانید به سادگی متن را انتخاب و کپی کنید، زیرا فایل حاوی هیچ داده “متن واقعی” نیست—فقط داده‌های تصویر. اگر داده‌ها را از یک وب‌سایت کپی کنید نیز ممکن است با همین سناریو مواجه شوید—اگر به عنوان یک تصویر آپلود شده باشد، هیچ متن واقعی برای کپی و پیست کردن ساده در گوگل شیت وجود نخواهد داشت. در عوض، تصویر را در Google Drive آپلود کنید. قبل از انجام این کار، مطمئن شوید که تصویر به درستی قرار گرفته است.

سپس، وارد Google Drive شوید، و فایل را بکشید و در پوشه مربوطه گوگل درایو رها کنید.

متناوباً، روی “New” در گوشه بالا سمت چپ کلیک کنید، “File Upload” را انتخاب کنید، و تصویری را که میخواهید تبدیل کنید پیدا کرده و آپلود کنید.

مرحله 2: باز کردن تصویر در Google Docs

اکنون که تصویر شما در Google Drive آپلود شده است، وقت آن است که فرآیند تبدیل را آغاز کنید. برای این کار، روی فایل راست‌کلیک کنید، روی “Open With” قرار بگیرید، و “Google Docs” را انتخاب کنید. بله، در نهایت میخواهید داده‌ها در Google Sheets باشند، اما این یک مرحله ضروری است که ابتدا باید انجام دهید.

در این مرحله، Google Docs در یک تب جدید باز می‌شود، با تصویر اصلی در بالای سند و داده‌های استخراج‌شده در زیر آن.

همچنین، اگر به پوشه Google Drive حاوی تصویر برگردید، خواهید دید که فایل Google Docs که به تازگی ایجاد کرده‌اید در همان مکان با همان نام ذخیره شده است.

مرحله 3: بررسی داده‌ها و اعمال تغییرات لازم

در حالی که OCR به طور کلی دقیق است، بسته به نحوه چیدمان داده‌ها در تصویر اصلی، همیشه بی‌نقص نیست. بنابراین، کمی وقت بگذارید تا داده‌ها را در فایل Google Docs که به تازگی ایجاد کرده‌اید بررسی کنید.

در این مثال، هدرهای ستون در تصویر در موقعیت‌های تصادفی در لیست داده‌های استخراج‌شده قرار گرفته‌اند، بنابراین من فعلاً این موارد را حذف میکنم و بعداً هنگام ویرایش داده‌ها در Google Sheets دوباره آنها را اضافه خواهم کرد.

همچنین، در انتهای لیست، آدرس‌های Spongebob، Superman و Sweeney Todd با هم مخلوط شده‌اند، بنابراین باید این اطلاعات را دوباره سازماندهی کنم تا کار با داده‌ها در مرحله بعدی آسان‌تر شود.

مرحله 4: کپی و پیست کردن داده‌ها در Google Sheets

اکنون که داده‌ها به درستی مرتب و سازماندهی شده‌اند، آماده انتقال به گوگل شیت هستند. برای این کار، داده‌ها را انتخاب کنید، در هر نقطه از ناحیه انتخاب‌شده راست‌کلیک کنید و روی “Copy” کلیک کنید.

اگر میخواهید داده‌ها را در یک صفحه گسترده جدید وارد کنید، در فضای خالی پوشه مربوطه گوگل درایو راست‌کلیک کنید و روی “Google Sheets” کلیک کنید.

از طرف دیگر، اگر از قبل فایل Google Sheets را تنظیم کرده‌اید، آن را پیدا کرده و باز کنید. سپس، روی سلولی که میخواهید اولین قسمت از داده‌های کپی‌شده در آن پیست شود، راست‌کلیک کنید، روی “Paste Special” قرار بگیرید و روی “Values Only” کلیک کنید. چسباندن داده‌ها فقط به عنوان مقدار، تمام قالب‌بندی، از جمله هرگونه ویژگی فاصله خطی که به طور خودکار توسط Google Docs اتخاذ شده است، را حذف میکند، بنابراین میتوانید با یک مجموعه داده تمیز کار کنید.

مرحله 5: قالب‌بندی داده‌ها

آخرین مرحله در تبدیل تصویر به داده، قالب‌بندی داده‌ها در گوگل شیت است، به طوری که دقیقاً همانطور که میخواهید ظاهر شود و رفتار کند.

در مورد من، لیست در یک ستون تنظیم شده است، اما من میخواهم نام‌ها، آدرس‌ها و مناطق در سه ستون جداگانه باشید.

راه‌های مختلفی برای تبدیل مجموعه داده بر این اساس وجود دارد، اما در مورد من، من قصد دارم از تابع TRANSPOSE استفاده کنم، که داده‌های افقی را به داده‌های عمودی تبدیل میکند (و بالعکس).

اگر میخواهید همین کار را انجام دهید، در سلول B2 تایپ کنید:

=transpose(A1:A3)

و Enter را فشار دهید.

اکنون، از آنجا که یک نام جدید در هر ردیف سوم ظاهر میشود، سلول‌های B1 تا B3 را انتخاب کنید و روی دسته پر کردن دوبار کلیک کنید تا فرمول TRANSPOSE در سلول‌های مربوطه در ستون B کپی شود.

بعد، تمام سلول‌های تازه جابجا شده را انتخاب کنید، Ctrl+C را فشار دهید تا آنها را کپی کنید، و Ctrl+Shift+V را فشار دهید تا فقط مقادیر را جایگذاری کنید. این کار داده‌ها را از لیست اصلی یک‌بعدی جدا می‌کند، به این معنی که میتوانید آن را حذف کنید، با این اطمینان که هیچ‌یک از داده‌های جابجا شده خود را از دست نخواهید داد.

اکنون، پس از راست‌کلیک کردن بر روی هدر ستون A و انتخاب “Delete Column”، باید ردیف‌های خالی را حذف کنید. برای انجام این کار، تمام ستون‌های حاوی داده‌ها را انتخاب کنید، و در تب Data، روی “Data Cleanup” قرار بگیرید، و روی “Remove Duplicates” کلیک کنید.

این کار یک ردیف خالی باقی میگذارد، که میتوانید با راست‌کلیک کردن بر روی هر سلول در آن ردیف و کلیک کردن بر روی “Delete Row” آن را به صورت دستی حذف کنید.

در نهایت، برای وارد کردن مجدد هدرهای ستون، روی هر سلول در ردیف 1 راست‌کلیک کنید، روی “Insert 1 Row Above” کلیک کنید، و هدرها را در صورت لزوم تایپ کنید.

اکنون میتوانید با انتخاب تمام سلول‌ها (از جمله هدرهای ستون)، راست‌کلیک کردن بر روی انتخاب و کلیک کردن بر روی “Convert To Table”، داده‌ها را به یک جدول Google Sheets قالب‌بندی شده تبدیل کنید.

سپس، روی فلش‌های رو به پایین در هر هدر ستون کلیک کنید و روی “Edit Column Type” قرار بگیرید تا اطمینان حاصل کنید که نوع داده صحیح به هر فیلد اختصاص داده شده است، و داده‌های تبدیل شده شما برای استفاده در صفحه گسترده Google Sheets شما آماده است!