آنچه خواهید خواند
روشهای استخراج داده از تصاویر
استخراج داده از تصاویر و انتقال دستی آن به یک فایل گوگل شیت میتواند زمانبر و پر از اشتباهات تایپی باشد.
خوشبختانه، با استفاده از ابزار Optical Character Recognition (OCR) در گوگل درایو، میتوانید این اطلاعات را در چند مرحله ساده به صفحه گسترده خود منتقل کنید. در اینجا نحوه انجام آن را شرح میدهیم.
نکات مهم قبل از شروع
قبل از شروع تبدیل متن موجود در تصویر به داده در Google Sheets، به این نکات توجه کنید تا فرآیند به درستی انجام شود:
کیفیت تصویر را بررسی کنید: هر چه کیفیت تصویر بهتر باشد، تبدیل بهتری انجام میشود. اگر تصویر شما یک اسکرینشات است، نباید مشکل چندانی وجود داشته باشد. با این حال، اگر با تلفن یا دوربین خود عکس میگیرید، مطمئن شوید که نور کافی وجود دارد و سایهها مانع دید نشوند. همچنین، سعی کنید دستتان ثابت باشد تا از تار شدن تصویر جلوگیری کنید.
از تصاویر با متن با وضوح بالا استفاده کنید: ارتفاع دادههای موجود در تصویر باید حداقل 10 پیکسل باشد.
مطمئن شوید که فرمت تصویر صحیح است: این فرآیند با فایلهای JPEG، PNG، TIFF و GIF کار میکند. اگر تصویر شما یکی از این فرمتهای فایل تصویری نیست، ابتدا آن را تبدیل کنید.
از تصاویر خیلی بزرگ استفاده نکنید: گوگل توصیه میکند که اندازه فایل 2 مگابایت یا کمتر باشد.
بهترین فونتها، فونتهای استاندارد هستند: اگر متن یا دادههای عددی موجود در تصویر دارای فونت غیرمعمول باشند، تبدیل ممکن است به خوبی که انتظار دارید کار نکند.
ممکن است قالببندی حفظ نشود: پس از اتمام تبدیل، برای ایجاد تغییرات دستی در قالببندی دادهها آماده باشید.
به یک حساب Google نیاز دارید: برای استفاده از این ابزار تبدیل OCR، باید وارد حساب Google خود شوید.
همچنین میتوانید مراحل موجود در این راهنما را برای تبدیل متن و اعداد موجود در فایلهای PDF اسکنشده به داده در Google Sheets دنبال کنید.
مرحله 1: آپلود تصویر در Google Drive
فرض کنید این تصویر را دانلود کردهاید—یک اسکرینشات از یک PDF حاوی نامها و آدرسهای مختلف در فرمت PNG—و میخواهید دادهها را استخراج و در Google Sheets ویرایش کنید.
برای دانلود رایگان یک کپی از این تصویر PNG، روی لینک کلیک کنید. پس از کلیک روی لینک، دکمه دانلود را در گوشه بالا سمت راست صفحه مشاهده خواهید کرد.
از آنجا که فایل یک تصویر PNG است، نمیتوانید به سادگی متن را انتخاب و کپی کنید، زیرا فایل حاوی هیچ داده “متن واقعی” نیست—فقط دادههای تصویر. اگر دادهها را از یک وبسایت کپی کنید نیز ممکن است با همین سناریو مواجه شوید—اگر به عنوان یک تصویر آپلود شده باشد، هیچ متن واقعی برای کپی و پیست کردن ساده در گوگل شیت وجود نخواهد داشت. در عوض، تصویر را در Google Drive آپلود کنید. قبل از انجام این کار، مطمئن شوید که تصویر به درستی قرار گرفته است.
سپس، وارد Google Drive شوید، و فایل را بکشید و در پوشه مربوطه گوگل درایو رها کنید.
متناوباً، روی “New” در گوشه بالا سمت چپ کلیک کنید، “File Upload” را انتخاب کنید، و تصویری را که میخواهید تبدیل کنید پیدا کرده و آپلود کنید.
مرحله 2: باز کردن تصویر در Google Docs
اکنون که تصویر شما در Google Drive آپلود شده است، وقت آن است که فرآیند تبدیل را آغاز کنید. برای این کار، روی فایل راستکلیک کنید، روی “Open With” قرار بگیرید، و “Google Docs” را انتخاب کنید. بله، در نهایت میخواهید دادهها در Google Sheets باشند، اما این یک مرحله ضروری است که ابتدا باید انجام دهید.
در این مرحله، Google Docs در یک تب جدید باز میشود، با تصویر اصلی در بالای سند و دادههای استخراجشده در زیر آن.
همچنین، اگر به پوشه Google Drive حاوی تصویر برگردید، خواهید دید که فایل Google Docs که به تازگی ایجاد کردهاید در همان مکان با همان نام ذخیره شده است.
مرحله 3: بررسی دادهها و اعمال تغییرات لازم
در حالی که OCR به طور کلی دقیق است، بسته به نحوه چیدمان دادهها در تصویر اصلی، همیشه بینقص نیست. بنابراین، کمی وقت بگذارید تا دادهها را در فایل Google Docs که به تازگی ایجاد کردهاید بررسی کنید.
در این مثال، هدرهای ستون در تصویر در موقعیتهای تصادفی در لیست دادههای استخراجشده قرار گرفتهاند، بنابراین من فعلاً این موارد را حذف میکنم و بعداً هنگام ویرایش دادهها در Google Sheets دوباره آنها را اضافه خواهم کرد.
همچنین، در انتهای لیست، آدرسهای Spongebob، Superman و Sweeney Todd با هم مخلوط شدهاند، بنابراین باید این اطلاعات را دوباره سازماندهی کنم تا کار با دادهها در مرحله بعدی آسانتر شود.
مرحله 4: کپی و پیست کردن دادهها در Google Sheets
اکنون که دادهها به درستی مرتب و سازماندهی شدهاند، آماده انتقال به گوگل شیت هستند. برای این کار، دادهها را انتخاب کنید، در هر نقطه از ناحیه انتخابشده راستکلیک کنید و روی “Copy” کلیک کنید.
اگر میخواهید دادهها را در یک صفحه گسترده جدید وارد کنید، در فضای خالی پوشه مربوطه گوگل درایو راستکلیک کنید و روی “Google Sheets” کلیک کنید.
از طرف دیگر، اگر از قبل فایل Google Sheets را تنظیم کردهاید، آن را پیدا کرده و باز کنید. سپس، روی سلولی که میخواهید اولین قسمت از دادههای کپیشده در آن پیست شود، راستکلیک کنید، روی “Paste Special” قرار بگیرید و روی “Values Only” کلیک کنید. چسباندن دادهها فقط به عنوان مقدار، تمام قالببندی، از جمله هرگونه ویژگی فاصله خطی که به طور خودکار توسط Google Docs اتخاذ شده است، را حذف میکند، بنابراین میتوانید با یک مجموعه داده تمیز کار کنید.
مرحله 5: قالببندی دادهها
آخرین مرحله در تبدیل تصویر به داده، قالببندی دادهها در گوگل شیت است، به طوری که دقیقاً همانطور که میخواهید ظاهر شود و رفتار کند.
در مورد من، لیست در یک ستون تنظیم شده است، اما من میخواهم نامها، آدرسها و مناطق در سه ستون جداگانه باشید.
راههای مختلفی برای تبدیل مجموعه داده بر این اساس وجود دارد، اما در مورد من، من قصد دارم از تابع TRANSPOSE استفاده کنم، که دادههای افقی را به دادههای عمودی تبدیل میکند (و بالعکس).
اگر میخواهید همین کار را انجام دهید، در سلول B2 تایپ کنید:
=transpose(A1:A3)
و Enter را فشار دهید.
اکنون، از آنجا که یک نام جدید در هر ردیف سوم ظاهر میشود، سلولهای B1 تا B3 را انتخاب کنید و روی دسته پر کردن دوبار کلیک کنید تا فرمول TRANSPOSE در سلولهای مربوطه در ستون B کپی شود.
بعد، تمام سلولهای تازه جابجا شده را انتخاب کنید، Ctrl+C را فشار دهید تا آنها را کپی کنید، و Ctrl+Shift+V را فشار دهید تا فقط مقادیر را جایگذاری کنید. این کار دادهها را از لیست اصلی یکبعدی جدا میکند، به این معنی که میتوانید آن را حذف کنید، با این اطمینان که هیچیک از دادههای جابجا شده خود را از دست نخواهید داد.
اکنون، پس از راستکلیک کردن بر روی هدر ستون A و انتخاب “Delete Column”، باید ردیفهای خالی را حذف کنید. برای انجام این کار، تمام ستونهای حاوی دادهها را انتخاب کنید، و در تب Data، روی “Data Cleanup” قرار بگیرید، و روی “Remove Duplicates” کلیک کنید.
این کار یک ردیف خالی باقی میگذارد، که میتوانید با راستکلیک کردن بر روی هر سلول در آن ردیف و کلیک کردن بر روی “Delete Row” آن را به صورت دستی حذف کنید.
در نهایت، برای وارد کردن مجدد هدرهای ستون، روی هر سلول در ردیف 1 راستکلیک کنید، روی “Insert 1 Row Above” کلیک کنید، و هدرها را در صورت لزوم تایپ کنید.
اکنون میتوانید با انتخاب تمام سلولها (از جمله هدرهای ستون)، راستکلیک کردن بر روی انتخاب و کلیک کردن بر روی “Convert To Table”، دادهها را به یک جدول Google Sheets قالببندی شده تبدیل کنید.
سپس، روی فلشهای رو به پایین در هر هدر ستون کلیک کنید و روی “Edit Column Type” قرار بگیرید تا اطمینان حاصل کنید که نوع داده صحیح به هر فیلد اختصاص داده شده است، و دادههای تبدیل شده شما برای استفاده در صفحه گسترده Google Sheets شما آماده است!


پاسخگوی سوالات شما هستیم
دیدگاهی وجود ندارد!