Posts Tagged ‘כינוי’
ד"ר רוביק רוזנטל / נערת הגומי של השפה
Posted in רוביק רוזנטל, tagged chewing gum, loom, loom bands, rainbow loom, rubber stamp, איש גומי, אלסטי, אצבעות, ביטוי, בלי גומיות, בנות, בנים גיל, בקבוק גומי, גולני, גומאויר, גומי לעיסה, גומיות, גומילום, הופעה מסודרת, הופעה מרושלת, חותמת גומי, חילות השדה, ישראל, כבש, כדורי גומי, כובעונים, כינוי, כינוי ישראלי, להיט, להיט חדש, מגב, מגב גומי, מגפי גומי, מדוגמת, מוצר, מותג מצליח, מלאכת כפיים, מסטיק, מצופה גומי, מקל גומי, משחק, נול, נול הקשת, נול פלסטיק, נסטלה, נערת גומי, סוכריות גומי, עיסוק, עץ, צבעים, צה"ל, צמיד, צמיד נול, צנחנים, צרכני, קונדומים, קנה סוף, קשירה, קשר, רוביק רוזנטל, שוב ושוב, שיגעון עולמי, שלגון, שם, שם ישראלי, שפה, תרבות on ינואר 18, 2018| 8 Comments »
בעולם של פעם הגומי צץ בתחומי צריכה שונים. חברה המייצרת מזרונים ספוגיים בחרה בשם המסחרי 'גומאויר' שהפך למותג מצליח. המגב ההודף את מי שטיפת הרצפה נקרא מקל גומי על פי פס הגומי שבקצהו. משחק פופולרי שעדיין לא נס לחו הוא 'גומיות', משחק דמוי קפיצה בחבל באמצעות שרוכי גומי.
כך או כך, הגומי הפך שם נרדף לאלסטיות, ולאו דווקא מחמיאה, כמו בביטוי "ארוך כמו מסטיק". בשירו של אבי קורן "שלווה" שמענו: "על המחנה נדלק ירח, על המאהל כוכב זורח, והזמן כמו גומי מתמרח, ליל שבת בלי טעם ובלי ריח".
האלסטיות של הגומי הפכה אותו חומר מבוקש ליצור כובעונים, או בשמם המוכר יותר קונדומים, שכונו גם 'גומי'. על המוצר הזה כתב חנוך לוין את המחזה "סוחרי הגומי". במחזה נתקע הגיבור עם מחסן עצום של קונדומים, בשנה שבה החלו הנשים להשתמש בגלולות למניעת היריון. עם פרוץ עידן האיידס העובר לגברים ולנשים באמצעות משגל חזר הגומי הזה לאופנה.
ד"ר רוביק רוזנטל / עשרים מי יודע? שפת התנ"ך במספרים
Posted in רוביק רוזנטל, tagged אב, אדוני, אופייני, אוצר, אל, אלוהים, אנשים, ארמית, אשכול, את, בניין, גוף, גרסא, הוא, היה, הכפלה, חיות, חכם, חלוקה, יהוה, יודע, יום, יחיד, יחס, ישראל, כינוי, כתיב, לשון, מופע, מורחב, מושא, מילה, מילון, מינוח, מלך, מספר, מקומות, מקרא, משמעות, נוכח, נטיות, נפוץ, נקבה, ספ"ר, עברי, על, עם, עצם, ערך, ערם, עשה, פועל, פיגורטיבי, פעם, פרטי, צורה, צמחים, קשר, שדי, שופטים, שם, שפה, תורה, תנ"ך on מרץ 16, 2017| 13 Comments »
1. בתנ"ך כ-7000 ערכים מילוניים עבריים (כולל פעלים בחלוקה על פי בניינים), וכן כאלף ערכים בארמית, ושמות פרטיים רבים מאוד של אנשים ומקומות.
2. המילה השלמה הנפוצה ביותר בתנ"ך היא 'אֶת' – כולל נטיותיה הרבות. 10903 פעם היא מופיעה לפני מושא מוצרך (כולל נטיות: אותי, אותנו), ועוד 553 במשמעות 'עִם' (כולל נטיות: אִתי, אִתָנו), ו-284 פעמים בצורה המורחבת 'מאת'. אליך, בן גוריון. גם מילות יחס נוספות כמו 'עם' ו'על' מובילות. למיליות נוכחות גבוהה. ל' מובילה (ללא נטיות): כ-20,000 הופעות, ב' – 15,000, כ' – 3000.
3. מילית הזיקה המקראית 'אֲשֶר' נפוצה מאוד: 5495. יש נוכחות נמוכה למילית הזיקה שֶ- האופיינית ללשון חכמים: 122 פעם, ופרט למופע יחיד בספר שופטים היא מופיעה תמיד בספרות המקראית המאוחרת.
4. שם העצם הנפוץ ביותר במקרא הוא בעצם שם פרטי מורחב: שמו של האל יהוה, הנכתב גם בגירסאות חלופיות כמו יי או יקוק: 6639 פעמים. כאשר מצרפים אליו את שמות האל הנוספים: אלוהים (2603), אדוני (425) אל (235), אלוה (57), שדי (48) מגיעים למספר הכמעט עגול 10007.
5. שמות העצם שאינם שמות האל הנפוצים ביותר בתנ"ך הם מלך (2518) המשמש לעיתים ככינוי לאלוהים, ו'ארץ' (2504).
6. השם הפרטי הנפוץ ביותר בתנ"ך הוא ישראל (2512). הוא משמש גם כשם אדם (יעקב), גם כשם הארץ וגם כשם הממלכה.
7. הפועל הנפוץ ביותר בתנ"ך הוא 'אמר': 5274 פעמים, כולל נטיות. אחריו, בהפרש ניכר, הפעלים 'היה' ו'עשה'.
8. המילה 'לא' נפוצה מאוד בתנ"ך – 5097 פעמים. לעומתה המילה 'כן' נמצאת במקום נמוך בהרבה: 563 הופעות.
9. שם התואר הנפוץ ביותר בתנ"ך הוא 'גדול' – 526 פעמים, אחריו בתור 'טוב' – 495 פעמים.
10. מילת הקריאה הנפוצה ביותר בתנ"ך היא 'הִנֵּה!', 1057 הופעות, ואחריה 'נא', 404.
11. כינוי הגוף הנפוץ ביותר בתנ"ך הוא 'הוא' – 1386. כינוי הגוף לנקבה 'היא' מדדה הרחק מאחורי הכינוי לזכר, עם 484 הופעות, כאשר בתורה הכתיב של הכינוי לנקבה הוא תמיד הִוא. כינוי הנסתרות הוא 'הֵנָּה' (30 הופעות), הצורה הנפוצה היום 'הֵן' אינה מופיעה בתנ"ך.
12. בתנ"ך כ-2100 מילים המופיעות בו פעם אחת ויחידה, כולל כאמור הופעות של שורש בבנייני פועל נפרדים. כלומר, כל מילה שלישית בתנ"ך מופיעה בו פעם אחת בלבד. מילים כאלה קרויות בשפה הבלשנית hapax legomenon ובמינוח העברי מילים יחידאיות.
13. בין אלפי המילים היחידאיות מילים רבות הנפוצות מאוד בעברית החדשה. דוגמאות: אָמָּן, אושר, בהיר, שום ובצל, גבינה וגבעול, דג ודיו, נדהם, התחמם וזָרַם, הגות, הורים, זכוכית, חֶברה, חותנת, מֶשֶק ועוד ועוד.
14. למעלה מ-1200 מילים במקרא הן מילים נטולות שורש על פי הופעתן במקרא. ביניהן מילים נפוצות כמו אב ואם, אף, פה ויד, שפה וגוף, דוב ואריה, הר וגיא, ציפור ונוצה ועוד ועוד. מילות היחס והכינויים הן בדרך כלל נטולות שורש. רוב שמות החיות והצמחים הם נטולי שורש מקורי. חלק מהמילים נטולות השורש המקראי נקשרות לשורש מאוחר יותר, בדרך כלל שורש שנגזר משם העצם: 'מאובן' ו'התאבנות' מאֶבֶן, 'ייהוד' מיהודי, 'התייתם' מיתום. במקרים רבים יותר נוספה למילים אלה סיומת שהרחיבה את השימוש במילה: אבהי (מ'אב'), זהות (מ'זה'), אשכולית (מ'אשכול') ועוד. לעיתים הסיומת נוספת כבר במקרא, כמו אחווה (מ'אח').
15. השפה המקראית היא פיגורטיבית וסיפורית, ובכל זאת יש בה לא מעט מילים בדרגת הפשטה גבוהה. הסיומת –וּת, שהיא סיומת המושג בעברית מופיעה בתנ"ך כשישים פעם. היא כוללת מילים רווחות כמו אלמְנוּת, אכזריוּת, מלכוּת, דמוּת, ילדוּת ועצלוּת.
16. בתנ"ך מעט מאוד שמות פעולה, עדות נוספת לאופי הסיפורי-פיגורטיבי של הלשון המקראית. כל שמות הפעולה הם בבניינים קל ופיעל. למשל: אכילה, בריאה, הליכה ועטישה; גידוף, לימוד, חיתול ופיתוח.
17. כ-700 מילים בתנ"ך מסתיימות בסיומת הנקבה –ָה, כגון ארוחה, בקעה, חומצה ומחשבה. כ-120 בסיומת –ת כגון מצנפת ושיבולת, וכ-50 בסיומת –ִית: מענית, צפיחית, קדורנית.
18. בתנ"ך כ-1500 שורשים. כ-10% מהם הם שורשים הומונימיים, כלומר, שורשים זהים שאינם קשורים ביניהם בקשר משמעות. ביניהם אז"ן (האזינו מול מאזניים), שח"ר (בוקר מול שחור), רד"ה (דבש ושלטון) ועוד ועוד. 16 שורשים הם הומונימים משולשים: צל"ל (צל, צליל ושקיעה), ער"ם (ערימה, עורמה ועירום) ועוד. השורש המגוון ביותר במקרא ובעברית בכלל הוא ער"ב, שלו שבע משמעויות שונות.
19. בתנ"ך מעט שורשים מרובעים, ורובם בפעלים מבנה ההכפלה: צפצף, טלטל, כרכר, התקשקש. מבנה ההכפלה קיים גם בכמה שמות עצם ותואר כמו ירקרק, שרשרת, סחרחר ואספסוף. השורשים המרובעים שאינם במבנה ההכפלה הם במילים 'מכורבל', הקשורה למילה הארמית כרבלא, שפירושה מעיל, ו'מחוספס'.
20. אוצר המילים של התנ"ך הוא הבסיס המוצק שעליו נשען אוצר המילים העברי החדש. שני שליש מן המילים שבהן אנו משתמשים בשפת יום יום, בתקשורת ובספרות הן מן התנ"ך.
עוד רשימות, מאמרים ותשובות של ד"ר רוביק רוזנטל באתר הזירה הלשונית, http://www.ruvik.co.il
נגה פורת / חיפוש שורשים
Posted in נגה פורת, tagged אותיות השימוש, ארגונים, ארכיון, בלשני, דוא"ל, חברות, חיפוש, טקסט, כינוי, כתיב חסר, כתיב מלא, לכשתלכנה, מאגר, מונח, מורפולוגי, מורפיקס, מזהה, מחשב, מידע ארגוני, מילון, מילים, מילת מפתח, מלינגו, מנוע חיפוש, מנוקד, מסמכים, משמעות, נטיות, ניתוח, ניתוח דקדוקי, ניתוח ההקשר, סֵפֶר, סַפָּר, סָפַר, עברית, עברית שפה קשה, על פי ההקשר, פועל, פיצוי, פעלים, צורת נטייה, צירוף, קובץ, רב-מילים, רב-משמעיות, שורשים, שמנו, שפה, תיקייה on אוגוסט 4, 2016| 3 Comments »
האם חיפשתם פעם הודעת דוא"ל בתיבה שלכם, או קובץ בתיקיית מסמכים במחשב? חיפוש כזה מתבסס גם על אמצעים לשוניים – על מילה או מילים מסוימות המופיעות בטקסט. ארגונים וחֲבָרות צריכים להתמודד עם כמויות עצומות של טקסטים: התכתבויות בדוא"ל, מסמכים שונים, ארכיונים ממוחשבים ועוד. כדי למצוא את כל התוצאות הרלוונטיות הם זקוקים למנועי חיפוש משוכללים. חיפוש מילות מפתח במאגר טקסטים הוא אתגר בכל שפה, ועל אחת כמה וכמה בעברית.
כידוע, 'עברית שפה קשה'. כמו בשפות שמיות אחרות, לרוב המילים בעברית יש נטיות רבות, ובייחוד לפעלים, הנוטים בכל הזמנים. כמעט לכל פועל יש לפחות 27 נטיות בסיסיות. חלק מהפעלים גם מאפשרים צירוף כינוי מושא חבור (שמע – 'שמעתיו', אהב – 'אהבתיה'), וזה מגדיל פי כמה וכמה את מספר הנטיות שלהם. בתחילת רוב המילים יכולות להצטרף גם אותיות השימוש, הידועות בראשי התיבות מש"ה וכל"ב: הבית, בבית, כשהלך. למילים רבות יש כתיב מלא וחסר, ובמילים לועזיות יש גם חלופות כתיב, כמו 'מוסיקה' ו'מוזיקה'. כל אלה מובילים להערכה שהעברית מורכבת מכ-70 מיליון צורות – מספר גדול בהרבה מאשר מספר הצורות האפשריות באנגלית ובמרבית השפות הנפוצות בעולם.
כמו כן, הכתיב הלא מנוקד בעברית אינו בהכרח מורה כיצד יש להגות כל מילה ומילה. לכן הרבה מילים נכתבות אותו דבר בלי ניקוד, גם בכתיב מלא, אך נהגות אחרת, כגון: סֵפֶר, סַפָּר, סָפַר (פועל) וסְפָר; כלומר, מילים רבות בעברית הן רב-משמעיות.
כאשר מחפשים במילון רב-מילים רצף אותיות רב-משמעי, מערכת הניתוח הדקדוקי של מילון רב-מילים מזהה את כל האפשרויות, כמו במילה 'שמנו' שדנתי בה בעבר. יתר על כן, רב-מילים מזהה גם כל צורת נטייה בצירוף כל אותיות השימוש האפשריות, לדוגמה: חיפוש 'לכשתלכנה' מוביל לפועל הָלַךְ; 'וכשבבתיהם' מוביל לשם העצם בַּיִת.
אם אתם משתמשים קבועים במילון רב-מילים, אולי כבר שמתם לב שמילון זה מזהה כל צורה עברית ומנתח אותה. גם במילון מורפיקס הקלדת רוב הצורות האלה בעברית תפנה לתרגום לאנגלית. תכונה זו משמעותית לא רק למילון, אלא גם לחיפוש במידע ארגוני.
במונחים בלשניים הדבר נקרא חיפוש מורפולוגי – חיפוש כל הנטיות של מילה כלשהי. לדוגמה, בחיפוש שם העצם 'איש' במנוע חיפוש רגיל, תתקבל רק הצורה כפי שהוקלדה: 'איש'. לעומת זאת, חיפוש מורפולוגי של מילה זו יחזיר את מגוון הנטיות שלה הקיימות בטקסט בצירוף כל אותיות השימוש האפשריות: כשלאיש, האנשים, לאנשֵי, ואנשיו וכיו"ב. בחיפוש מורפולוגי של הפועל 'ישב' יתקבלו נטיות מגוונות המצויות בטקסט בצירוף אותיות שימוש: כשישבתם, לכשתשבנה, יושבֵי, וישב, שְבוּ, בשבתו ועוד ועוד. גם צירופי מילים נכללים בחיפוש המורפולוגי. לדוגמה, מילות החיפוש 'יום הולדת' יובילו גם לתוצאות של 'יום ההולדת', 'ביום הולדתה', 'ימי הולדת' וכן הלאה.
ריבוי התוצאות הזה מתקבל בחיפוש המורפולוגי הבסיסי (מצומצם) של מלינגו. אנו מציעים גם חיפוש מורפולוגי מורחב לפי 'משפחת המילים' של מילת החיפוש. משפחת מילים כוללת את כל המילים שנגזרו מאותו שורש ויש ביניהן קשר סמנטי הדוק. למשל, נניח שחברת ביטוח רוצה למצוא בדוא"ל הארגוני שלה את כל המילים מהמשפחה של 'פיצוי'. החיפוש הבסיסי יזהה גם את כל הנטיות, כמו 'יפצוהו' (יפצו אותו) וגם צורות כתיב חסר כמו 'פצוי', 'פצויים'. החיפוש המורחב יציג גם את כל המילים מהשורש פצ"י שקשורות במשמעות למילה זו: את כל הנטיות האפשריות של הפעלים פִּצָּה ופֻּצָּה (פיצו אותו), אך לא את הפועל פָּצָה (פֶּה), שנגזר מאותו שורש אך אין לו אותה משמעות, ולכן הוא אינו שייך ל'משפחה' הזו. יתר על כן, חיפוש כזה גם לא יציג את המילה (השאולה מאיטלקית) פִּיצָה, שבמקרה נכתבת בכתיב מלא (ללא ניקוד) בדיוק כמו הפועל 'פִּצָּה'. מנגנון החיפוש מזהה רק את המילים המבוקשות בעזרת ניתוח ההקשר שבו מופיעה המילה. לכן, כאשר שאילתת החיפוש כוללת את המילה פיצוי, והחיפוש הוא מורחב, יתקבלו תוצאות שבהן משפטים כמו "הביטוח פיצה את הלקוח", אבל לא יתקבלו משפטים כמו "הלקוח קנה פיצה".המערכת יודעת להבחין שבמקרה הראשון מדובר בפועל שקשור ב'פיצוי', אבל במקרה השני מדובר בשם העצם 'פיצה' ולא בפועל. כך החיפוש המורפולוגי מאתר את כל המילים הרלוונטיות לפי משמעותן בהקשר נתון.
אם ברצונכם לדעת עוד על החיפוש המורפולוגי של מלינגו על פי הקשר המילה בטקסט, היכנסו לדף הזה: http://www.melingo.com/text-analysis/cs/.