ניקוי טקסט
הסרת רווחים מיותרים, שורות ריקות מרובות, תווים בלתי-נראים, ועוד. בלחיצה אחת.
ניקוי טקסט מהיר ומקיף. מוריד רווחים כפולים, שורות שבורות, תווים בלתי-נראים, תווי שליטה, ו-zero-width characters שמסתננים בעת העתקה מ-PDF, Word, או דפי אינטרנט. הכלי משלב מספר אפשרויות שאפשר להפעיל או לכבות בנפרד: צמצום רווחים, איחוד פסקאות, הסרת תווי שליטה, ועוד. שימושי לכותבים שמכינים תוכן ל-CMS, לעורכים שעובדים עם טקסטים שהגיעו ממקורות שונים, למפתחים שמשלבים תוכן ב-JSON, ולכל מי שמעתיק טקסט ומוצא שמשהו "לא נראה נכון" אבל לא יודע מה. הכל קורה בדפדפן. הטקסט שלכם, גם אם הוא חסוי, לא יוצא מהמכשיר.
איך משתמשים בכלי?
- 01הדביקו טקסטהטקסט שלכם, עם כל הלכלוך. רווחים, שורות, תווים נסתרים.
- 02בחרו אפשרויותהפעילו או כבו את הניקויים הרלוונטיים לפי הצורך.
- 03העתיקו את התוצאהטקסט נקי, מוכן לשימוש בכל מקום שתבחרו.
מתי זה שימושי?
- טקסט מ-PDF לבלוגמאמר ב-PDF יוצא עם שורות שבורות באמצע משפט. ניקוי טקסט מאחד אותן ושומר על פסקאות.
- הכנת טקסט ל-CMSמערכות CMS לפעמים שומרות תווי שליטה שמשבשים את התצוגה. ניקוי לפני הדבקה. תצוגה נקייה.
- הסרת רווחים מ-spreadsheetנתונים מ-Excel לעיתים מגיעים עם רווחים בקצוות שגורמים לטעויות בהשוואות ובמיון. ניקוי מהיר.
- טקסט מאתר אינטרנטהעתקת טקסט מ-HTML לפעמים מביאה Non-Breaking Space ותווים נסתרים. ניקוי מסיר אותם.
- הכנת prompt ל-AIAI מודלים רגישים לפורמט. טקסט עם רווחים מיותרים יכול לבזבז טוקנים. ניקוי לפני שליחה לחיסכון.
- הודעת מייל ארוכהמייל ארוך שיובא מ-Word לעיתים נראה מבולגן עם רווחים מוזרים. ניקוי לפני שליחה לחזות מקצועי.
דוגמאות שימוש
- טקסט מועתק מ-PDFהרבה פעמים יש רווחים כפולים ושורות שבורות. ניקוי מאחד אותם בלחיצה אחת.
- טקסט מתוך מסמך Wordמגיע עם תווים בלתי-נראים (zero-width) שנדבקים בטעות. הניקוי מסיר אותם.
- הכנת טקסט לאימיילהופכים פסקאות שבורות לטקסט אחד רציף עם "הסר את כל שבירות השורה".
- תוצאה מ-OCRסריקה של מסמך עם OCR לעיתים מוסיפה רעש. ניקוי מסיר את הרווחים והתווים החריגים.
טיפים לתוצאה טובה יותר
- בדקו את התוצאההסרת שבירות שורה אגרסיבית יכולה לאחד פסקאות שלא רציתם. השוו את לפני ואחרי לפני שמדביקים.
- שמרו עותק מקוריאם זה טקסט חשוב, שמרו את הגרסה המקורית בקובץ נפרד. הכלי לא יכול לבטל פעולות.
- הפעילו את "צמצום רווחים" תמידרווחים כפולים הם הכי שכיחים בטקסט הגיע. צמצום שלהם לרוב לא משפיע על המשמעות אבל מנקה הרבה רעש.
- אחרי ניקוי. ספרו תוויםאם הניקוי הוא לפוסט עם מגבלת אורך, השתמשו בסופר תווים שלנו לאחר ניקוי לוודא שאתם בטווח.
מה זה תווים בלתי-נראים ולמה הם מציקים
תווי שליטה (control characters) ו-zero-width characters הם תווים שלא רואים, אבל הם בקובץ. הם נכנסים בעת העתקה מתוכנות מסוימות (Word, Adobe Acrobat, אתרים מסוימים), ויכולים לשבש: • השוואות טקסט בקוד או ב-spreadsheet ("a" ו-"a" עם תו נסתר ייראו זהים אבל לא ייחשבו זהים) • מיון לקסיקוגרפי • הצגה ב-CMS (לעיתים יוצרים רווח מוזר) • חיפוש בתוך מסמכים הסרתם. פותרת בעיות שלפעמים קשה לאתר מהיכן הן באו.
אפשרויות הניקוי. מה כל אחת עושה
צמצום רווחים: רווחים מרובים (שניים ויותר) יהפכו לרווח אחד. גם tabs יהפכו לרווח אם מסומן. איחוד שבירות שורה: שתי שורות ריקות רצופות יהפכו לאחת. שלוש ריקות יהפכו לאחת. מנקה רעש שיוצרים מסמכים מובאים. הסרת תווי שליטה: כל תו לא-נראה (zero-width space, BOM, וכד׳) יוסר. חיתוך רווחים בקצוות: מסיר רווחים מתחילת וסוף כל שורה ומהמסמך כולו.
מתי לא לנקות
יש פעמים שדווקא רוצים לשמור על המבנה המקורי: • שירה. שבירות שורה הן חלק מהמבנה האמנותי • קוד. רווחים והזחה הם תחביר משמעותי • רשימה בנקודות מ-Word. לעיתים שבירות השורה מבדילות בין פריטים • ASCII art. כל תו חשוב במקרים האלה. או אל תשתמשו בכלי, או הפעילו רק חלק מהאפשרויות.
דוגמאות לטקסט שהכלי חוסך זמן בו
מאמר שהורד מ-PDF: לרוב יש שורות שבורות באמצע משפט (כי PDF מסיים שורה במידה ויזואלית, לא לוגית). הכלי מאחד אותן. טקסט מ-Wikipedia: לפעמים מועתק עם הערות שוליים, רווחים מובילים, ותווי Unicode אזוטריים. תוצאה של OCR: סורק מסמך וממיר לטקסט. תמיד יש רעש שצריך לנקות לפני שמשתמשים בטקסט. תגובה מ-AI: לעיתים יוצרת רווחים לפני סימני פיסוק, או רווחים כפולים אחרי נקודה.
פרטיות
הטקסט שלכם נשאר במכשיר. אין שליחה לאף שרת. גם טקסט עם פרטים אישיים, מסחריים, או רגישים. בטוח לניקוי. אחרי סגירת הטאב, הכל נמחק מהזיכרון.
שאלות נפוצות
מה זה תווים בלתי-נראים?
תווי שליטה ו-zero-width characters שנכנסים בטעות כשמעתיקים מאפליקציות אחרות. הם משברים השוואות, מיון, וחיפוש. בלי שתראו אותם.
האם נשמרים tabs?
כן, אם "צמצום רווחים" כבוי. אם הוא פעיל, הם נדחסים לרווח יחיד. אם אתם עובדים עם קוד או טבלת TSV. תכבו את האפשרות.
האם זה הופך עברית למשהו אחר?
לא. הטקסט נשאר עברי מלא. רק הרווחים והתווים הנסתרים מטופלים. אותיות, ניקוד, וסימני פיסוק עבריים נשמרים.
האם הטקסט נשלח לשרת?
לא. הכול מתבצע בדפדפן בלבד. אין העלאה, אין שמירה, אין מעקב.
איך אני יודע אם יש תווים נסתרים בטקסט שלי?
הסימנים: רווחים שלא נראים אחרי המילה האחרונה, התנהגות מוזרה בחיפוש (חיפוש לא מוצא תוצאות שאתם רואים), או רוחב טקסט גדול ממה שמצופה. ניקוי טקסט יסיר אותם.
הכלי מסיר ניקוד עברי?
לא. הניקוד נשמר. הכלי מסיר רק תווי שליטה ו-zero-width. לא תווים גלויים. אם רוצים להסיר ניקוד, צריך כלי ייעודי.
אפשר לבטל פעולה?
לא. הכלי לא שומר היסטוריה. אם אתם עובדים על טקסט חשוב. שמרו עותק מקורי בקובץ נפרד לפני הניקוי.
הניקוי הסיר משהו שרציתי לשמור. מה לעשות?
נסו לכבות חלק מהאפשרויות והפעילו רק את הרלוונטיות. למשל, אם איבדתם פסקאות. תכבו את "איחוד שבירות שורה". כל אפשרות עובדת בנפרד.

