הסרת שורות כפולות
הסרה אוטומטית של שורות כפולות מטקסט. מהיר, נקי, ובדפדפן בלבד.
הסרת שורות כפולות בלחיצה. נקה רשימה ארוכה של אימיילים, מספרי טלפון, מילות מפתח, או כל טקסט בנוי שורה-בשורה. הכלי תומך בכמה אפשרויות חכמות: התעלמות מאותיות גדולות/קטנות, חיתוך רווחים בקצוות שורה (כדי לתפוס כפילויות חבויות), ומיון אלפביתי אופציונלי. מתאים לאנשי שיווק שמנקים רשימות תפוצה, ל-data analysts שעובדים עם נתונים גולמיים, למפתחים שמנקים log files, ולכל מי שצריך לעבוד עם רשימה ייחודית. הסופר גם מציג כמה שורות הוסרו, כדי שתדעו את היקף הניקוי. הכל בדפדפן, בלי שליחה לאף שרת, גם רשימות עם מידע רגיש.
איך משתמשים בכלי?
- 01הדביקו טקסטכל שורה תיבדק מול האחרות. אפשר להדביק רשימה ארוכה עד עשרות אלפי שורות.
- 02בחרו אפשרויותהתעלמות מאותיות גדולות/קטנות, חיתוך רווחים, מיון אלפביתי.
- 03העתיקו את התוצאההתוצאה מוכנה. מספר השורות שהוסרו מוצג גם כן.
מתי זה שימושי?
- רשימת אימיילים מ-CRMיצוא מ-CRM לפעמים מחזיר את אותו לקוח כמה פעמים. הסרת כפילויות לפני קמפיין דיוור חוסכת כסף ושמירה על reputation.
- איחוד רשימות מ-Excelמאחדים שתי רשימות אימיילים מ-spreadsheet-ים שונים. הסרת כפילויות חוסכת שעות של עבודה ידנית.
- מילות מפתח ל-SEOאחרי מחקר מילות מפתח מכמה כלים (Ahrefs, Semrush, גוגל). הרבה חופפות. נקה כפילויות לפני שמעלים ל-spreadsheet הסופי.
- ניקוי log filesשורות שגיאה חוזרות בלוג מקשות לאתר את הבעיה האמיתית. הסרת כפילויות מצמצמת רעש.
- רשימת URL לסריקהאיסוף URLs מסקריפטים שונים. לפעמים יש כפילויות. ניקוי לפני שמכניסים ל-Screaming Frog או כלי SEO אחר.
- רשימת מספרי טלפוןדאטהבייז של לקוחות עם כפילויות. ניקוי לפני SMS מסיבי או קמפיין וואטסאפ עסקי.
דוגמאות שימוש
- רשימת אימיילים מ-CRMהדביקו רשימה ארוכה. כל כפילות תוסר. שורה ראשונה נשארת, החזרות נמחקות.
- רשימת ערכים מ-Excelבדרך כלל מועתק עם רווחים מובילים. הפעילו "חיתוך רווחים" כדי לתפוס גם כפילויות חבויות.
- מיון אלפביתיהפעילו "מיון". התוצאה תוחזר מסודרת בעברית/אנגלית לפי locale עברי.
- התעלמות מאותיות גדולות"John@example.com" ו-"john@example.com" יוכרו כאותה כתובת. שימושי לרשימות אימיילים שבאו מכמה מקורות.
טיפים לתוצאה טובה יותר
- הפעילו "חיתוך רווחים" תמידהכי הרבה כפילויות חבויות באות מרווחים בקצוות. " מייל@דומיין.קום " ו-"מייל@דומיין.קום". אותו אימייל בעצם.
- הפעילו "התעלמות מרישיות" לאימייליםאימיילים הם case-insensitive בעולם האמיתי. ABC@gmail.com = abc@gmail.com. בלי האפשרות הזו תפספסו כפילויות.
- מיון אופציונלי, לא תמיד נחוץאם הסדר חשוב לכם (למשל סדר כרונולוגי של אירועים), אל תפעילו מיון. אם זו רק רשימה לסקירה. מיון עוזר.
- לעבודה גדולה. שמרו עותק קודםהכלי לא עושה undo. אם אתם עובדים עם 50,000 שורות חשובות, שמרו את הרשימה המקורית לפני הניקוי.
איך מזוהות כפילויות
הכלי בודק כל שורה מול השורות שלפניה. שורה זהה מילה במילה (אחרי הפעלת אפשרויות חיתוך/רישיות) תוסר. השורה הראשונה תמיד נשמרת. הופעות נוספות נמחקות. הסדר המקורי נשמר אלא אם בחרתם במיון.
אפשרויות מתקדמות
חיתוך רווחים (trim): מסיר רווחים מהתחלה ומהסוף של כל שורה לפני ההשוואה. " test " ו-"test" יזוהו כזהים. ההשפעה רק על ההשוואה. השורות בתוצאה נשארות עם הרווחים שהיו במקור. התעלמות מרישיות (case-insensitive): "TEST" ו-"test" יזוהו כזהים. ההשפעה רק על ההשוואה. הצורה המקורית של השורה הראשונה היא זו שנשמרת. מיון: ממיין את התוצאה הסופית אלפביתית לפי locale עברי. מתאים גם לטקסט עברי וגם לאנגלית.
מה הכלי לא עושה
הכלי לא מזהה דמיון חלקי. רק שורות זהות. "john.smith@gmail.com" ו-"j.smith@gmail.com" נחשבות שורות שונות, גם אם זה אותו אדם. הוא גם לא מזהה כפילויות חכמות במספרי טלפון. "050-1234567" ו-"0501234567" נחשבים שונים. לעבודה כזו צריך נירמול קודם (למשל הסרת מקפים עם ניקוי טקסט).
פרטיות
כל העיבוד מתבצע בדפדפן. רשימות אימיילים, טלפונים, או נתונים אישיים. לא יוצאים מהמכשיר. אין שליחה לשרת, אין שמירה, אין לוגים. נקיון נתונים גם בנושאים רגישים.
שאלות נפוצות
האם השורה הראשונה תמיד נשארת?
כן. השורה הראשונה של כל כפילות נשמרת; הופעות נוספות מוסרות. הסדר המקורי נשמר אלא אם מפעילים מיון.
מה ההבדל בין "חיתוך רווחים" לבין השארת רווחים?
אם מסומן, " דוגמה " ו-"דוגמה" ייחשבו זהות. אם לא, הן ייחשבו שונות. רוב הזמן כדאי להפעיל את האפשרות הזו.
איך עובד המיון?
מיון אלפביתי לפי locale עברי (he-IL). מתאים גם לעברית וגם לאנגלית, וגם לרשימות מעורבות.
האם הטקסט נשלח לשרת?
לא. הכול מתבצע מקומית בדפדפן. אין העלאה, אין שמירה, אין לוגים.
יש הגבלה על כמות שורות?
תיאורטית עד כמה שהדפדפן יכול לטפל. בפועל זה עשרות אלפי שורות במחשבים מודרניים. ברשימה של 100,000+ שורות הדפדפן עלול להאט.
אפשר להסיר כפילויות לא-מלאות (similar lines)?
לא. הכלי מזהה רק שורות זהות אחרי הפעלת האפשרויות. לדמיון חלקי צריך כלי מורכב יותר (fuzzy matching) שלא נתמך כאן.
איך מטפלים בהבדל בין "ABC" ו-"abc"?
הפעילו "התעלמות מרישיות". שתי הצורות יזוהו כזהות. אם לא מפעילים, הן ייחשבו שונות (case-sensitive).
אפשר להפוך את הסדר במקום מיון?
הכלי לא מציע היפוך סדר, רק מיון אלפביתי. להיפוך פשוט, אפשר להעתיק את התוצאה לאקסל ולמיין שם, או להשתמש בכלי אחר.

