Feeds:
רשומות
תגובות

Posts Tagged ‘פעלים’

חגי תשרי חלפו, ובימים אלה אנו חוזרים לשגרה. בשפה הצבאית נוצרו ראשי התיבות חזל"ש – חזרה לשגרה (בהגייה: חַזְלָש), ומהם נגזר הפועל הסלנגי לְחַזְלֵשׁ – 'לחזור לשגרה'. מניין באה המילה שִגְרָה?

מילה זו שאולה מהמילה הארמית שִׁגְרָא. בתלמוד היא  מופיעה בצירוף "שיגרא דתמרי" (כתובות פ, ע"א), שפירושו הפסולת שהושלכה לאחר סחיטת התמרים (לצורך הכנת נוזל כמו סילאן או שֵׁכַר תמרים). השורש שג"ר מופיע בתלמוד ובכתבי חז"ל אחרים בכמה פעלים בארמית ובעברית במובן 'הזיל, שפך, יצק, השליך, הטיל'. יש המקשרים שורש זה עם השורש גר"ר.  לדוגמה, במדרש 'סדר אליהו רבה' (פרק ח') נכתב: "מיד עיניהם משגרות דמעות", כלומר: מזילות דמעות. בכתבי חז"ל חוזר בכמה וריאציות הביטוי: "שגורה תְּפִלָּתו בפיו" (למשל: תוספתא, ברכות ג, ג), ומכאן – הצירוף שָׁגוּר בְּפִיו. המילה 'שגור' היא צורת הבינוני הפעול (צורת ההווה הסבילה בבניין קל) של השורש שג"ר, ומשמעותה הראשונית היא 'נשפך, זורם, ניגר'. גם מילים אחרות מתחום הנוזלים מתארות דיבור רהוט, רציף ומהיר: 'קולח', 'שוטף', 'שטף דיבור' ועוד. גם המילים המקבילות באנגלית fluent ו-fluency קשורות למילה fluid (נוזל).

 בלשון חז"ל נגזר מהשורש שג"ר שם העצם אַשְׁגָּרָה – רהיטות, שטף דיבור או כתיבה, למשל: "אשגרת לשון" (ירושלמי, תרומות, פרק א, הלכה א; וראו גם "השגרת לשון", ירושלמי, ברכות, פרק ב, הלכה ד). בפסקי הלכה של רבנים בלשון ימי הביניים מצוי הביטוי הקרוב שִׁגְרָא דְּלִשָּׁנָא. ביטוי עברי דומה מופיע בהקדמה לתרגום 'ספר הרקמה' של ריב"ג. היה זה ספר דקדוק עברי שנכתב במקור בערבית (בתקופת תור הזהב בספרד), ובמאה ה-12 תרגם אותו המתרגם הנודע יהודה אבן תיבון. בהקדמה לתרגום פנה אבן תיבון לקוראיו והפציר בהם שלא לשפוט אותו לחומרה אם ימצאו טעויות בלשון התרגום. הוא הסביר שעלול היה לטעות בניסוח העברי בהשפעת שפת אימו – הערבית: "כל שכן עם שגרת הלשון הערבי בפינו וברעיוננו".

לימים החלו להשתמש במילה 'שִגרה' כמילה יחידה במשמעות הזו: רהיטות, שטף, מהירות הנובעת מהרגל רב בשימוש במשהו (בעיקר בלשון), לדוגמה:"הוא פלט את הדבר בהיסח הדעת מתוך שגרת הדיבור." בעברית החדשה מילה זו הרחיבה את משמעותה: אין היא מציינת רק הרגל לשוני (טקסט שנוהגים לחזור עליו שוב ושוב כמו תפילה),  אלא גם הרגל בתחומי החיים האחרים (סדר עניינים רגיל וקבוע החוזר על עצמו). בחיבורו 'גילוי וכיסוי בלשון' כתב ביאליק: "רגעים כאלה מעטים מאוד גם בשגרת הלשון וגם בשגרת החיים […]". כך הפכה המילה 'שגרה' למקבילה העברית למילה הלועזית רוּטִינָה. מקורה של המילה הלועזית במילה הצרפתית routine (הקיימת גם באנגלית), שנגזרה מהמילה route (דרך).

המשמעות המורחבת של המילה 'שגרה' נשתגרה בעברית עד כדי כך שנוצרו המילים 'חזל"ש' ו'חִזְלֵשׁ'. לפועל 'נִשְׁתַּגֵּר' (או 'השתגר') יש משמעות נוספת, נפוצה פחות: 'נשלח'. השורש שג"ר משמש במובן שליחה בפעלים נוספים, כגון: שיגר ושֻׁגַּר. גם לפעלים אלה יש עדויות ברבדים ההיסטוריים של העברית. לדעת רוב החוקרים, יש קשר בין שתי המשמעויות של שג"ר – המשמעות הראשונית של השורש הייתה 'השליך, יצק, שפך', וממנה נגזרו גם המובן של רהיטות לשונית וגם המובן 'שלח, הריץ, הזרים, העביר' (הדבר הנשלח נתפס כנוזל המועבר מכלי לכלי, או העובר בצינורות ממקום למקום). ואולם אין על כך הסכמה גורפת. סבוכה עוד יותר היא שאלת הקֶשר למילה המקראית היחידה הנגזרת מהשורש שג"ר – שֶׁגֶר, למשל: "וְכָל-פֶּטֶר שֶׁגֶר בְּהֵמָה" (שמות יג יב), כלומר: כל ולד בכור של הבהמה. יש פרשנים המקשרים את המילה הזו, הקשורה בהולדה, במשמעות הראשונית של השורש שג"ר – הטלה. אבל לפי דעה אחרת, למילה זו יש מקור משלה והיא אינה קשורה למשמעויות האחרות של אותו השורש.

חזל"ש נעימה!

נגה פורת / מחז"ל לחזל"ש

Read Full Post »

הפעלים 'לגמור' ו'לסיים' ירדו לעולם כתאומים, כלומר, פעלים נרדפים, אבל בעולם השפה אין תאומים זהים. יש כידוע צמדי מילים לא מעטים, שמות כמו פעלים, של מילים נרדפות שמשמעותן זהה ובכל זאת אינן זהות. מה המפתח להבחין ביניהן? לעתים יש שוני קל במשמעות, אך המפתח הנכון הוא מפתח השימוש. השפה החיה מעניקה תפקידים מתפקידים שונים לכל אחת מהמילים בצמד, וזה מה שקרה לתאומים שעל הפרק, הפעלים ‘לגמור’ ו’לסיים’.

הפועל ‘גמר’ מופיע במקרא חמש פעמים, ומתוכן פעמיים במשמעות גמל, והאחרות במשמעות כלה או תם. בלשון חז"ל הוא נפוץ מאוד. ‘סיים’ צץ לראשונה רק בלשון חז"ל, ובעקבותיו שם הפעולה ’סיום’ אצל רש"י. לפי המילון האטימולוגי של ארנסט קליין המקור של ‘סיים’ הוא השורש הקדום שי"ם. מאז  משמשים ‘גמר’ ו’סיים’ באותו תחום משמעות: השלמת עניין, כאשר מדובר בדיבור או במעשה. גם בעברית החדשה שתי הנרדפות שלנו רודפות זו את זו, והדוגמה המובהקת היא בתחום ההשכלה: ‘בחינת גמר’ ו’בחינת סיום’ מחליפות זו את זו ללא שינוי המשמעות. ‘מסוים’ התלמודי משמש מאז במשמעות ‘ספציפי’, ‘גימור’ המודרני יוחד לתיאור עבודות ליטוש אחרונות.

ההתפצלות הבולטת בשימוש בין שני הפעלים חלה באופן מובהק בזירת לשון הדיבור. ‘גמר’ נבחר לשרת את המישלב הדיבורי, ויש לו תפוצה רחבה מאוד בסלנג. הביטוי שטבע אפרים קישון ‘זבנג וגמרנו’ שייך לאתוס הבטחוני הציוני, ועל כך אמר רבין בימי האינתיפאדה הראשונה כי "אין פתרונות צ'יק צ'ק זבנג וגמרנו". ‘גמור’ פירושו מחוסל, בעיקר במשמעות עייף או מחוסל ציבורית. הניב ‘נגמר לו הסוס’ נולד ככל הנראה כתרגום שאילה של הביטוי האנגלי at the end of one’s tether, שפירושו מילולית ‘בסוף הרסן’, ומשמעותו: הגיע לסוף כוחותיו. על כך מספרים את הבדיחה המלעיגה על החייל היהודי של מלחמות המאה ה-19. מצטרף יהודי לחיל הפרשים ומתחיל לדהור, ותוך כדי דהרה צועק למפקדו: "נגמר לי הסוס, תביא לי סוס חדש". את השימוש ב’גמר’ במשמעות הרג או חיסל אפשר לגלות אפילו בספר תהילים: "יגמור נא רע רשעים".

‘סיים’ נתפס כפועל במשלב גבוה מעט יותר מ’גמר’, מעודן מעט ממנו, וכמעט שאינו מופיע בצירופי סלנג. למשל, כאשר רוצים להעיר לדובר שהוא מאריך בדבריו  אנחנו מעדיפים את הנוסח "אתה מתבקש לסיים" המנומס על פני "תגמור כבר" הבוטה.  "סיים תואר ראשון" נשמע מהוגן יותר מ"גמר אוניברסיטה", ביטוי שזכה לשימושים אירוניים-סטיריים בדיווח על מתקפה של מעצמה אזורית או עולמית כלשהי על מוסד השכלה בארץ אויב. דווקא בספורט מככב הביטוי הקלאסי "רגל מסיימת", אבל אין להתפלא על כך. בין הספורט העברי והשפה העברית, בעיקר בתחום הכדורגל, יש יחסי אהבה מתקדמים.

בתחום המיני ‘גמר’ הוא התחליף המקובל ל- come האנגלי, במשמעות הגיע לאורגזמה, הקרויה בעקבות קהלת אביונה. רמז לשימוש  הזה אפשר למצוא כבר בלשון חז"ל. בילקוט שמעוני מפרשים את שמה של גומר אשת הושע: "ויאמר ה' אל הושע, לך קח לך אשת זנונים וילדי זנונים וגו', וילך ויקח את גומר בת דבלים. מאי גומר? אמר רב, שהכל גומרים בה". מכל מקום, השימוש המיני בפועל התחזק כבר בעשורים האחרונים של המאה העשרים, גם בהשפעת סטלה המגמרת מהסרט "אסקימו לימון", וכמעט שחיסל כל שימוש אחר בפועל הוותיק הזה, שזלג אל תחומי הטאבו הלשוני. כתוצאה מכך הפך 'סיים' לפועל המוביל, וירד ממרומי השפה הספרותית לשפת היומיום. דובר המתקרב לסוף דבריו יאמר "אני מיד מסיים", ואם ייפלט לו (!) "אני תיכף גומר" יזכה לצחקוקים מהקהל. במסעדות החליפה שאלת הנימוסין של המלצרים "סיימת?" את השאלה "גמרת?" פעוטים הצועדים בשבילי הלשון כבר אינם מכירים את 'גמר': הם רק מסיימים.

אז האם ניתן לברך על המוגמר, ולומר "ואידך זיל גמור", כדברי הלל הזקן לגוי התר אחרי מפגש חפוז עם התורה? אפשר, אבל יש לזכור שגם כאן השפה העברית מתעתעת בנו. לשורש גמ"ר לא פחות משלוש משמעויות, ואין ביניהן קשר אטימולוגי-היסטורי, אלא מה שקוראים הגששים הצטרפות מקרים. גמ"ר א' הוא כאמור מקראי,  ואילו גמ"ר ב' וגמ"ר ג' מקורם בארמית, והם משמשים בתלמוד. גמ"ר ב' פירושו ללמוד, ומכאן 'גמרא', שהוא שמו הארמי של התלמוד. כאשר אמר הלל "ואידך זיל גמור" התכוון: ומכאן, צא ולמד. גמ"ר ג' פירושו הקטיר קטורת, וכאשר מבקשים "לברך על המוגמר" הכוונה היא לברך על הקטורת: "כל המוגמרות מברכין עליהן", "אין מברכין לא על המוגמר ולא על הבשמים בבית האבל". 'מוגמר' היא קטורת של בשמים הנשרפים באש, שנהגו להכניס למקום הסעודה כדי שתפיץ ריח טוב, ונבדלת מ'קטורת' שיועדה לצורכי קודש. בעברית החדשה התקבע הצירוף בהוראה חדשה עקב זהות השורשים גמ"ר א' וגמ"ר ג'. מכאן גם המילה הארמית 'גומרא', גחלת. מחלת האנטרקס נקראת בעברית  גַחֶלֶת, אבל בפרסומי משרד החקלאות היא נקראת גַמֶּרֶת. המדרש מספר על תולעת שפלוני "היה מתירא ממנו, רואה אותה כגחלת, ונקראת גוּמרַת לילה; אמר לו [הרב]: מזו אתה מתירא? בלילה היא גחלת ויוקדת, יבוא הבוקר ואתה רואה שאינה אלא תולעת". ביאליק לא אהב את שמה התלמודי של התולעת מפיצת האור, והציע את המילה הנפלאה גחלילית. אני גמרתי.

עוד רשימות, מאמרים ותשובות של ד"ר רוביק רוזנטל באתר הזירה הלשונית,   http://www.ruvik.co.il

%d7%94%d7%a8%d7%a9%d7%94-%d7%9c%d7%99-%d7%9c%d7%92%d7%9e%d7%95%d7%a8

 

Read Full Post »

בישראל חילופי ממשלות הם עניין של שיגרה, ועל פי השפה נראה שדוברי העברית הם שליטים מבטן ומלידה. כמות הפעלים הנרדפים בתחום הזה מפתיעה, ולכולם שורשים בתנ"ך: למשול, לשלוט, למלוך, לרדות, לשרור ועוד. ‘ממשלה’ עצמה מופיעה כבר בבראשית א' במשמעות שלטון: "המאור הגדול לממשלת היום, והמאור הקטן לממשלת הלילה". באותו פרק מצטווה האדם לרדות "בדגת הים ובעוף השמיים".

הפועל ‘לרדות’ אומץ לדיקטטורות, ומנהיגיהן הם 'רודנים'. ’ממלכה’ התגלגלה בישראל הדמוקרטית לשם תואר: ‘ממלכתי’.  לעומת ‘ממלכתי’ האידיאולוגי, ‘ממשלתי’ הוא מושג בירוקרטי, ו’ממשלה’ השתרשה במשמעות המוסדית, השלטון המרכזי של המדינה. במשמעות הזו היא מופיעה במקרא רק פעם אחת, בספר דברי הימים, כאשר סנחריב צר על לכיש "וכל ממשלתו עמו". ביתר ההופעות במקרא ‘ממשלה’ פירושה שלטון. מחדשי השפה אימצו את הכפילות הזו. מילון המילים האבודות של עוזי אורנן מביא לצד שימושים ב’ממשלה’ במשמעות שלטון את ‘ממשלה אדירה’ במשמעות מעצמה, ו’ממשלת עיר’ במשמעות עירייה.

הממשלה היא הרשות המבצעת של ה‘מדינה’, שנגזרה מהשורש די"ן, ומופיעה במגילת אסתר במשמעות אזור או פלך שיש בו מערכת משפטית אוטונומית. בשפה האנגלית, בעקבות הוריה החוקיים הגרמנית והצרפתית, המילה היא state, וכאן הדגש הוא על היסוד המייצב והמארגן של קיום המדינה.

חבר הממשלה הוא ‘שר’, דהיינו, בעל שררה.  הבריטים בחרו לאותו תפקיד מילה צנועה יותר: minister, שהשתרשה גם בכנסייה ופירושה משרת, בהתייחסות ל-minus בהוראת קטן או משני. ראש הממשלה הוא ‘ראש השרים’. גם האמריקנים היו צנועים: The Obama Administration, ‘ממשל אובמה’ פירושו המנגנון או המנהלה של אובמה, ויש קשר לשוני ישיר בין minister לadministration-. הצירוף הישראלי-עברי ‘הממשל האמריקני’ נבחר  כדי להבדיל בין הדגם האמריקני לבין ממשלה מהדגם האירופי. בישראל הוא נקרא פשוט ‘הממשל’, והעומד בראשו ‘הנשיא’, ללמדך על עומק יחסינו עם הדוד סם.

יש ממשל, ויש ממשל. בחלק מימי המנדט הטילו הבריטים  ‘ממשל צבאי’ על פלשתינה. המודל הזה הוחל על ערביי ישראל מאז קום המדינה ועד 1966, ועל הפלשתינים בשטחים אחרי 1967. בין ‘ממשל’ ו’ממשלה’ יש בהקשר זה קירבה לשונית גם בשפה האנגלית. הממשל הצבאי הוא military government, הממשלה היא סתם government. מקור המילה בפועל הלטיני gubernare והיווני kubernan  שמשמעותם ‘לאחוז בהגה’. הפועל היווני הזה הוליד גם ’קברניט’ העברי, מילה תלמודית שפירושה רב חובל, והיא הפכה בעברית החדשה דימוי לשוני להנהגה, בצירופים ‘קברניטי המדינה’ או ‘קברניטי המשק’. יסוד לדימוי אפשר למצוא כבר במקורות, כמו במדרש תנחומא: "משל לאחד שהיה מושלך לתוך המים, הושיט הקברניט את החבל, אמר לו: תפוש את החבל הזה בידך ואל תניחהו, שאם תניחהו אין לך חיים, אף כך אמר להם הקב"ה לישראל, כל זמן שאתם מדובקים במצוות – חיים כולכם היום".

המציאות הפוליטית הישראלית המיוחדת הדביקה ל’ממשלה’ תארים והגדרות שונים ומשונים. הצירוף ‘ממשלת אחדות לאומית’ או ‘ממשלת אחדות’ הוא ייחודי למדינת  ישראל, ומוכר בדמוקרטיה המערבית מתקופה קצרה בבריטניה בעת המלחמה בנאצים. הורתה של ממשלת האחדות ב’ממשלת הליכוד הלאומי’, רצף של שלוש ממשלות שכיהנו בין 1967 ל-1970. ריבוי המפלגות ושיטות הממשל המתחלפות בישראל יצרו צירופים נוספים וייחודיים: ‘ממשלת מיעוט’, ‘ממשלה צרה’, ‘ממשלה רחבה’, ממש בוטיק.

ח"כ מוחמד ברכה הוצא בעבר מן המליאה על שקרא לממשלת אריאל שרון ופואד בן אליעזר "ממשלת דמים".  את הביטוי הזה השמיע לפניו יו"ר הכנסת בעבר אברהם בורג, שכינה כך את הממשלה במכתב לבן אליעזר. גם בורג לא המציא את זה. הוא נשמע מפי בנימין נתניהו ורחבעם זאבי, ונישא בכרזות הימין לפני רצח רבין. במאמר בנושא מזכיר יובל שטייניץ את הקריאות "ממשלת דמים, ממשלת זדון" בהפגנות שלום עכשיו בהם השתתף כנגד ממשלת בגין-שרון.

"ממשלת דמים" הוא צירוף חדש, אך יש לו הד מן המקורות, החל מ"צא, צא איש הדמים" בשמואל, ועד "עיר דמים" ביחזקאל. בתפילת ראש השנה נאמר: "וכל הרשעה כולה כעשן תכלה, כי תעביר ממשלת זדון מן הארץ", והוא נשמע בישראל החדשה. הרב ש"ך הגדיר כך את ממשלת רבין לפני הרצח. חוגי החרדים הרבו לצטט את הפסוק מן התפילה במאמרים כנגד ברק. להבדיל, בהפגנת מחאה של חסרי בית בכיכר המדינה נתלה שלט: "סילבן שרון – ממשלת זדון". כדאי לכל המשתמשים  בצירוף הזה לקרוא את המכתב  שכתבו 500 רבנים לנשיא פרנקלין רוזוולט על המתרחש באירופה בשנת 1943: "אנא יקשיב וישמע לאנקת אחינו המפרפרים בין החיים והמות תחת ידי ממשלת זדון הנאצים האכזריים".

הבריטים קוראים למדינתם "הממלכה המאוחדת", למרות שהיא בפועל דמוקרטיה. בעיצוב שפת השלטון הישראלית יש נוכחות חשובה לשם התואר ‘ממלכתי’, המשמש כשם כולל לכל מה ששייך למדינה, או נמצא תחת פיקוחה. השימוש בו הוא ביטוי לתפיסה הבן גוריונית, שרצה להסיר את הבעלות של התנועות האידיאולוגיות מימין ומשמאל על מוסדות, טקסים ומערכות. הצבא הוא ממלכתי לעומת הפלמ"ח, מערכת החינוך היא ממלכתית לעומת זרם העובדים הסוציאליסטי. כדי להביא את המסר האידיאולוגי הזה היה צורך במילה טעונה ואידיאולוגית, ומה לנו טעון יותר מן התנ"ך, האהוב על בן גוריון, ומממלכת יהודה שהפכה למדינת ישראל?

בן גוריון החל להשתמש במילה הרבה לפני קום המדינה. הוא מצא בה את הביטוי לרעיון האחדות כנגד הפלגנות של תפיסות מעמדיות מבית מדרשו של טבנקין. ב-28 לאוקטובר 1928, בהרצאה במגדיאל, מדבר בן גוריון על "המעבר מתנועה שאינה קובעת אלא דעות והשקפות, לתנועה הקובעת את דרך החיים של האיש והאחריות לבניין ארץ, המטפלת בדאגות ממלכתיות, יישוביות, תרבותיות ומקצועיות, והעומדת במרכז של גאולת העם". את המילה הזו ירש באמצעות שאילת משמעות מן השפה הרוסית.

עם השנים שמר ‘ממלכתי’ על מעמדו כשם תואר רשמי לכל מה שהוא בפיקוחה או תחום ניהולה של המדינה, אבל איבד  את העומק האידיאולוגי שלו. לכל היותר מתובלת 'ממלכתי' בדוק אירוני. ‘אווירה ממלכתית’ השורה על אירוע מרמזת שהיה כבד ומשעמם, אך מכובד בהחלט. המקום היחיד בו ממלכתי הוא המונח הרשמי הוא תחום החינוך היסודי. יש חינוך ממלכתי, יש חינוך ממלכתי-דתי, ויש חינוך עצמאי, המסונף לממלכת השמים.

עוד רשימות, מאמרים ותשובות של ד"ר רוביק רוזנטל באתר הזירה הלשונית,   http://www.ruvik.co.il

ד"ר רוביק רוזנטל / ממשלה מאוד ממלכתית

Read Full Post »

האם חיפשתם פעם הודעת דוא"ל בתיבה שלכם, או קובץ בתיקיית מסמכים במחשב? חיפוש כזה מתבסס גם על אמצעים לשוניים – על מילה או מילים מסוימות המופיעות בטקסט. ארגונים וחֲבָרות צריכים להתמודד עם כמויות עצומות של טקסטים: התכתבויות בדוא"ל, מסמכים שונים, ארכיונים ממוחשבים ועוד. כדי למצוא את כל התוצאות הרלוונטיות הם זקוקים למנועי חיפוש משוכללים. חיפוש מילות מפתח במאגר טקסטים הוא אתגר בכל שפה, ועל אחת כמה וכמה בעברית.

כידוע, 'עברית שפה קשה'. כמו בשפות שמיות אחרות, לרוב המילים בעברית יש נטיות רבות, ובייחוד לפעלים, הנוטים בכל הזמנים. כמעט לכל פועל יש לפחות 27 נטיות בסיסיות. חלק מהפעלים גם מאפשרים צירוף כינוי מושא חבור (שמע – 'שמעתיו', אהב – 'אהבתיה'), וזה מגדיל פי כמה וכמה את מספר הנטיות שלהם. בתחילת רוב המילים יכולות להצטרף גם אותיות השימוש, הידועות בראשי התיבות מש"ה וכל"ב: הבית, בבית, כשהלך. למילים רבות יש כתיב מלא וחסר, ובמילים לועזיות יש גם חלופות כתיב, כמו 'מוסיקה' ו'מוזיקה'. כל אלה מובילים להערכה שהעברית מורכבת מכ-70 מיליון צורות – מספר גדול בהרבה מאשר מספר הצורות האפשריות באנגלית ובמרבית השפות הנפוצות בעולם.

כמו כן, הכתיב הלא מנוקד בעברית אינו בהכרח מורה כיצד יש להגות כל מילה ומילה. לכן הרבה מילים נכתבות אותו דבר בלי ניקוד, גם בכתיב מלא, אך נהגות אחרת, כגון: סֵפֶר, סַפָּר, סָפַר (פועל) וסְפָר; כלומר, מילים רבות בעברית הן רב-משמעיות.

כאשר מחפשים במילון רב-מילים רצף אותיות רב-משמעי, מערכת הניתוח הדקדוקי של מילון רב-מילים מזהה את כל האפשרויות, כמו במילה 'שמנו' שדנתי בה בעבר. יתר על כן, רב-מילים מזהה גם כל צורת נטייה בצירוף כל אותיות השימוש האפשריות, לדוגמה: חיפוש 'לכשתלכנה' מוביל לפועל הָלַךְ;  'וכשבבתיהם' מוביל לשם העצם בַּיִת.

אם אתם משתמשים קבועים במילון רב-מילים, אולי כבר שמתם לב שמילון זה מזהה כל צורה עברית ומנתח אותה. גם במילון מורפיקס הקלדת רוב הצורות האלה בעברית תפנה לתרגום לאנגלית. תכונה זו משמעותית לא רק למילון, אלא גם לחיפוש במידע ארגוני.

במונחים בלשניים הדבר נקרא חיפוש מורפולוגי – חיפוש כל הנטיות של מילה כלשהי. לדוגמה, בחיפוש שם העצם 'איש' במנוע חיפוש רגיל, תתקבל רק הצורה כפי שהוקלדה: 'איש'. לעומת זאת, חיפוש מורפולוגי של מילה זו יחזיר את מגוון הנטיות שלה הקיימות בטקסט בצירוף כל אותיות השימוש האפשריות: כשלאיש, האנשים, לאנשֵי, ואנשיו וכיו"ב. בחיפוש מורפולוגי של הפועל 'ישב' יתקבלו נטיות מגוונות המצויות בטקסט בצירוף אותיות שימוש: כשישבתם, לכשתשבנה, יושבֵי,  וישב, שְבוּ, בשבתו  ועוד ועוד. גם צירופי מילים נכללים בחיפוש המורפולוגי. לדוגמה, מילות החיפוש 'יום הולדת' יובילו גם לתוצאות של 'יום ההולדת', 'ביום הולדתה', 'ימי הולדת' וכן הלאה.

ריבוי התוצאות הזה מתקבל בחיפוש המורפולוגי הבסיסי (מצומצם) של מלינגו. אנו מציעים גם חיפוש מורפולוגי מורחב לפי 'משפחת המילים' של מילת החיפוש. משפחת מילים כוללת את כל המילים שנגזרו מאותו שורש ויש ביניהן קשר סמנטי הדוק. למשל, נניח שחברת ביטוח רוצה למצוא בדוא"ל הארגוני שלה את כל המילים מהמשפחה של 'פיצוי'. החיפוש הבסיסי יזהה גם את כל הנטיות, כמו 'יפצוהו' (יפצו אותו) וגם צורות כתיב חסר כמו 'פצוי', 'פצויים'. החיפוש המורחב יציג גם את כל המילים מהשורש פצ"י שקשורות במשמעות למילה זו: את כל הנטיות האפשריות של הפעלים פִּצָּה ופֻּצָּה (פיצו אותו), אך לא את הפועל פָּצָה (פֶּה), שנגזר מאותו שורש אך אין לו אותה משמעות, ולכן הוא אינו שייך ל'משפחה' הזו. יתר על כן, חיפוש כזה גם לא יציג את המילה (השאולה מאיטלקית) פִּיצָה, שבמקרה נכתבת בכתיב מלא (ללא ניקוד) בדיוק כמו הפועל 'פִּצָּה'. מנגנון החיפוש מזהה רק את המילים המבוקשות בעזרת ניתוח ההקשר שבו מופיעה המילה. לכן, כאשר שאילתת החיפוש כוללת את המילה פיצוי, והחיפוש הוא מורחב, יתקבלו תוצאות שבהן משפטים כמו "הביטוח פיצה את הלקוח", אבל לא יתקבלו משפטים כמו "הלקוח קנה פיצה".המערכת יודעת להבחין שבמקרה הראשון מדובר בפועל שקשור ב'פיצוי', אבל במקרה השני מדובר בשם העצם 'פיצה' ולא בפועל. כך החיפוש המורפולוגי מאתר את כל המילים הרלוונטיות לפי משמעותן בהקשר נתון.

אם ברצונכם לדעת עוד על החיפוש המורפולוגי של מלינגו על פי הקשר המילה בטקסט, היכנסו לדף הזה: http://www.melingo.com/text-analysis/cs/.

 

נגה פורת / חיפוש שורשים

Read Full Post »

%d בלוגרים אהבו את זה: