בזרזירית זה נשמע יותר טוב

מאמר שהתפרסם בכתב העת Nature טוען שלזרזיר המצוי יש יכולת ללמוד מבנים תחביריים המוגדרים על-ידי אחת התכונות המהותיות ביותר של השפה האנושית: רקורסיה. האם זה אומר משהו על היכולת הלשונית של האדם?

במחקרים מוקדמים שלו משנות ה-50, הראה נעם חומסקי שאת כלל השפות הניתנות להגדרה מתמטית (כולל "שפות" שאין להן כל קשר לשפות אנוש) ניתן לחלק ל-4 קטגוריות, הנבדלות זו מזו ברמת המורכבות התחבירית שלהן (ושל המנגנונים הנדרשים כדי לזהות אותן). ארבע הקטגוריות המרכיבות את ההיררכיה של חומסקי, בסדר יורד של מורכבות, הן:

  • שפות מטיפוס 0: שפות הניתנות למניה רקורסיבית (recursively enumerable languages)
  • שפות מטיפוס 1: שפות תלויות הקשר (context sensitive languages)
  • שפות מטיפוס 2: שפות חסרות הקשר (context free languages)
  • שפות מטיפוס 3: שפות רגולריות (regular languages)

ההגדרה המדויקת של הקטגוריות השונות דורשת ידע רב במושגי היסוד של מדעי המחשב, ולא נדון בה כאן. מה שחשוב לצורך הדיון הנוכחי הוא העובדה שעד כה מקובל היה לחשוב שהשפה האנושית היא מערכת התקשורת היחידה בעולם החי שידוע עליה שאינה שפה רגולרית (כלומר, אינה מטיפוס 3). שפות רגולריות כוללות, למשל, שרשראות קבועות מראש של סימנים, או שרשראות קבועות עם אפשרות לחזרה על חלקים מסוימים; שפות פשוטות אלה מספיקות לתיאור כל מערכות התקשורת המוכרות מעולם החי (פרט לשפה האנושית). לגבי המורכבות התחבירית של השפה האנושית, לעומת זאת, אין ודאות מוחלטת: עד שנות השמונים ניטשו מחלוקות בשאלה האם השפות האנושיות הן שפות חסרות הקשר (טיפוס 2) או תלויות הקשר (טיפוס 1); הדעה המקובלת יותר היא שהן אינן שפות חסרות הקשר (ראו למשל המאמר הזה או הזה). בכל מקרה, ישנה תמימות דעים ששום שפה אנושית אינה שפה רגולרית (טיפוס 3).

הסיבה המרכזית לכך ששפה אנושית אינה יכולה להיות שפה רגולרית היא קיום מבנים רקורסיביים בשפה טבעית. רקורסיה, בהקשר זה, היא האפשרות לשבץ מבנה תחבירי כלשהו בתוך מבנה תחבירי אחר מאותו סוג. קיימות דוגמאות רבות לרקורסיה בשפה טבעית; למשל:

  • כל משפט יכול להכיל בתוכו משפט משועבד (שיכול גם הוא להכיל משפט משועבד נוסף, וכו'). למשל: "דן אמר שרינה שכחה שיוסי יודע שהגשם ייפסק".
  • צירוף סמיכות יכול להכיל בתוכו צירוף סמיכות נוסף, וכו'. למשל: "הכחשת גניבת כספי תושבי העיר".
  • צירוף יחס (כלומר, צירוף של מילת יחס וצירוף שמני) יכול להכיל צירוף יחס נוסף, וכו'. למשל: "ספר עם מאמרים על תופעות בלי הסבר".

שפה שכוללת בתוכה אפשרות לרקורסיה אינה שפה רגולרית, ולכן ברור לחלוטין ששום שפה אנושית אינה שפה רגולרית. לאור זאת, טענו חוקרים מסוימים שהיכולת לעבד מבנים רקורסיביים היא המאפיין העיקרי שמבדיל בין היכולת הלשונית של האדם לבין כל שאר בעלי החיים.

המחקר החדש שהתפרסם ב-Nature קורא תיגר על טענה זו. המחקר בדק את יכולת זיהוי התבניות אצל זרזירים, ציפורים ששירתם מורכבת משני סוגים עיקריים של קולות: סוגים שונים של נקישות (rattle), וקטעים (קבועים מראש) של זמרה (warble). טענת החוקרים היא שאחרי אימון של מספר חודשים, הצליחו הזרזירים להבחין בין שני סוגים של "שפות":

  • שפה רגולרית: מספר כלשהו של רצפים של נקישה-זמרה (בסדר הזה)
  • שפה חסרת הקשר: מספר כלשהו של קטעי נקישות, ואחריו מספר זהה של קטעי זמרה

מבחינת המורכבות המתמטית, השפה השניה מורכבת יותר היות והיא מחייבת "זכרון": אחרי מספר מסוים של קטעי נקישה, מספר קטעי הזמרה חייב להתאים למספר קטעי הנקישה שקדמו לכך. מורכבות זו מקבילה לזו הדרושה ליצירת מבנים רקורסיביים, כך שהיכולת להבחין בין שתי השפות שלעיל מצביעה, לדברי החוקרים, על כך שלזרזירים יש את אותה יכולת שלגביה נטען שהיא ייחודית לאדם.

קיימות, עם זאת, מספר בעיות מהותיות במסקנות החוקרים מהמחקר. למשל:

  • המחקר בדק זיהוי "משפטים" באורך שאינו עולה על 8 קטעים, ורובו עסק במשפטים של 4 קטעים בלבד; כלומר, הבחנה בין נקישה-זמרה-נקישה-זמרה לבין נקישה-נקישה-זמרה-זמרה. כל עוד אורך המשפטים הוא מוגבל, שתי השפות הן למעשה שפות רגולריות; השפה השניה היא שפה חסרת הקשר רק בתנאי שאין מגבלה קבועה מראש על אורך המשפטים. לכן, מבחינת ההבחנה המתמטית, ניסוי זה למעשה לא הראה דבר.
  • כמו שהראה מארק ליברמן ב-Language Log, המשימה הספציפית שבה נבחנו הזרזירים היא משימה קשה ביותר עבור בני אדם, למרות כישורי השפה שמאפשרים לנו ללמוד שפות חסרות הקשר. לכן, כלל לא ברור שיכולת לשונית והיכולת להבחין בין שני סוגי השפות הללו בזמן אמת גוררות זו את זו.
  • כמו שכבר ציינתי, חוקרים רבים סבורים ששפות אנושיות הן בעלות מורכבות מתמטית גדולה יותר מאשר של שפות חסרות הקשר, ושהיכולת הלשונית של האדם כוללת מאפיינים רבים פרט ליכולת ליצור מבנים רקורסיביים וללמוד שפה חסרת הקשר. לכן, הטענה שלזרזירים יש יכולת ללמוד שפה חסרת הקשר היא בעלת חשיבות בלשנית רק ביחס לטענה הקיצונית, שלפיה הדבר היחיד שמבדיל בין היכולת האנושית ליכולתם של בעלי-חיים אחרים הוא היכולת ליצור מבנים רקורסיביים.

לאור כל ההסתייגויות הללו, אני נוטה להצטרף לעמדתם של מי שכבר כתבו שהמסקנה היחידה שאפשר להסיק בבירור ממחקר זה היא שזרזירים הם ציפורים הרבה יותר חכמות ממה שנדמה לנו. לגבי הבנת היכולת האנושית, אני בספק אם יש למחקר זה חשיבות כלשהי.

2 תגובות בנושא “בזרזירית זה נשמע יותר טוב”

  1. גבי, לגבי הטענה ששפה שכוללת בתוכה אפשרות לרקורסיה היא לא רגולרית, מה בדבר:
    S –> A | epsilon
    A –> aA | epsilon

    זוהי שפה הכוללת אפשרות לרקורסיה אבל היא עדיין רגולרית (מיוצגת על ידי הביטוי הרגולרי a*‎).

    ברור לי שהשפה האנושית אינה רגולרית, אבל נראה לי שצריך לדייק קצת יותר את ההסבר לכך ולציין במדויק איזה מבנה רקורסיבי בדקדוק של שפה טבעית לא יכול להיות מיוצג על ידי ביטוי רגולרי.

  2. אתה צודק במאה אחוז: ההגדרה לרקורסיה שנתתי לא מבחינה בין שפות רגולריות לשפות חסרות הקשר. האמת היא שרוב המאמרים שמתקשרים בצורה זו או אחרת לנושא הזרזירים (ומחקרים שקדמו לכך) לא נותנים הגדרה ברורה, ואיכשהו מניחים שכולנו יודעים מה סוג הרקורסיה שבאמת מעניין אותנו. לפעמים יש בהקשר הזה התייחסות לרקורסיה מסוג center embedding, כלומר למבנים מהסוג:
    X -> α X β
    כש-α ו-β הם מחרוזות לא ריקות.
    מה שמשעשע בהקשר הזה היא העובדה הידועה שלמרות ששפות טבעיות מאפשרות, מבחינת הדקדוק שלהן, center embedding, זה מוביל די מהר לקשיי עיבוד. למשל:
    1. הילד בכה.
    2. הילד שהכלב נשך בכה.
    3. הילד שהכלב שהאיש ליטף נשך בכה.
    המשפט האחרון הוא אולי דקדוקי, אבל קשה מאד לעיבוד. ודווקא על center embedding מתנהל כל הדיון. (ומצד שני, הדוגמאות האלה הן אולי לא בדיוק סוג הרקורסיה שניסחתי למעלה- אבל אני כבר מתחיל לסטות מהנושא קצת יותר מדי).

סגור לתגובות.