המדריך המלא: עריכת קבצי PDF בחינם (עם תמיכה בעברית)
עריכת קובץ PDF בעברית או המרתו לקובץ אקסל/וורד היא משימה מתסכלת (הטקסט מתהפך, הופך לג'יבריש או נשבר). במדריך זה ריכזנו את תוכנות ה-Desktop החינמיות המובילות לצד הכלים המקוונים שעובדים. כבונוס טכנולוגי ענק, בנינו עבורכם מחולל סקריפט אוטומטי ב-Python שלוקח קובץ PDF סרוק, מבצע לו OCR (זיהוי אופטי), וממיר אותו לוורד או אקסל תוך שמירה על כיוון קריאה תקין (RTL).
1. תוכנות חינמיות מומלצות להתקנה (Desktop)
כשמדובר בקבצים כבדים, רגישים או מרובי עמודים, תמיד עדיף לעבוד עם תוכנה מקומית על המחשב (ללא העלאת מסמכים לענן).
PDFgear
יורשת הכתרנחשבת היום לאלטרנטיבה החינמית הטובה ביותר ל-Acrobat Pro. מאפשרת עריכת טקסט ישירה, מיזוג, המרה, וכוללת אפילו צ'אט מבוסס בינה מלאכותית (Copilot) שקורא את המסמך ויודע לסכם אותו או לענות על שאלות. תמיכה מעולה בעברית וללא סימני מים.
הורדת PDFgearPDF24 Creator
כלי עבודה טכניארגז הכלים השוויצרי למנהלי רשתות. זוהי תוכנה שמתקינה את עצמה כ"מדפסת וירטואלית" ומספקת ממשק פשוט לחיבור/חיתוך קבצים, הקטנת נפח, ופיצ'ר OCR פנימי מעולה שמזהה עברית בצורה לא רעה בכלל כשהוא פועל אופליין.
הורדת PDF24PDF-XChange Editor
הכי מהירה בשוקתוכנה קלילה ומהירה להפליא. הגרסה החינמית לא מאפשרת עריכת טקסט עמוקה, אך היא הטובה ביותר לצורך הוספת הערות, סימונים (Highlight), חתימות דיגיטליות, שרטוטים, והוספת תיבות טקסט על גבי טפסים קיימים.
הורדת PDF-XChange2. כלים מקוונים וטריקים (Web)
רוצים לתקן שגיאת כתיב אחת או לשלוף טקסט במהירות בלי להתקין כלום? הנה הכלים שכדאי להכיר:
Google Docs OCR
הטריק הסודיהטריק הטוב ביותר לעברית: העלו קובץ PDF (אפילו תמונה סרוקה) ל-Google Drive שלכם. לחצו עליו קליק ימני -> פתח באמצעות -> Google Docs. גוגל תריץ עליו אלגוריתם OCR מטורף מאחורי הקלעים ותייצר לכם קובץ וורד קריא לגמרי!
כניסה ל-DriveSejda PDF
עריכה ישירהכלי מקוון נהדר לעריכה ישירה. הוא מתמודד יפה עם פונטים בעברית ומאפשר מחיקת שורות קיימות והחלפתן בטקסט חדש בקלות (מוגבל ל-3 משימות או קבצים עד 50MB בחינם ביום).
פתיחת Sejda3. התקנת דרישות קדם לסקריפט (Tesseract)
הסקריפט שלנו מבוסס על פייתון. כדי שמחשב ה-Windows שלכם ידע לזהות עברית ולחתוך קבצי PDF, חובה להתקין את הכלים הבאים פעם אחת בלבד:
- התקנת Tesseract OCR: זהו מנוע זיהוי הטקסט של גוגל (קוד פתוח). הורידו את מתקין ה-Windows מ-הקישור הזה.
⚠️ חשוב מאוד: במהלך ההתקנה, במסך בחירת הרכיבים, פתחו אתAdditional language dataוסמנו ב-V את השפה ה-Hebrew (עברית). - התקנת Poppler (חיתוך PDF לתמונות): הסקריפט חייב את הכלי הזה כדי "לצלם" את ה-PDF. הורידו את גרסת ה-Windows מ-כאן. חלצו את קובץ ה-ZIP לכונן C (כך שיהיה לכם נתיב:
C:\poppler), והוסיפו את תיקיית ה-binשלו למשתני הסביבה (Environment Variables -> Path). - התקנת חבילות הפייתון: פתחו את שורת הפקודה (CMD) והריצו:
pip install pytesseract pdf2image python-docx pandas openpyxl
4. מחולל סקריפט: OCR מעברית לוורד / אקסל
יש לכם עשרות מסמכי PDF סרוקים? הסקריפט הזה קורא כל עמוד, מריץ עליו זיהוי בעברית ואנגלית (heb+eng), ומדפיס את התוצאה לקובץ .docx עם יישור לימין (RTL) או לקובץ אקסל מסודר לפי עמודים.