הסדרי נגישות
עמוד הבית > מדעים > ביולוגיה
גליליאו : כתב עת למדע ומחשבה



תקציר
מדוע טבוע החיקוי כל כך עמוק בהתנהגות חיות חברתיות - כולל האדם? לחיקוי, מתברר, יש יתרונות רבים, אם כי גם חסרונות.



בינת הנחיל
מחבר: ישראל בנימיני


מדוע טבוע החיקוי כל כך עמוק בהתנהגות חיות חברתיות - כולל האדם? לחיקוי, מתברר, יש יתרונות רבים, אם כי גם חסרונות

חיקוי מושכל

אנו נוטים לחשוב על חיקוי כהתנהגות לא אינטליגנטית: במקום החשיבה העצמאית באה החלטה עיוורת המוכתבת על יד התנהגות האנשים שמסביב החקיין. אם כך, מדוע טבוע החיקוי כל כך עמוק בהתנהגות האנושית, כמו בהתנהגות של חיות חברתיות אחרות? אם בחיקוי יש רק חסרונות, הרי ניתן היה לצפות כי במהלך האבולוציה ייעלמו מהעולם הפרטים והמינים הנוטים להתנהגות כזו. מובן כי הדבר אינו כך: גם אם נתעלם מתפקידו המרכזי של החיקוי בלמידה אצל יצורים צעירים מתוך הידע שצברו כבר הבוגרים, נשארת העובדה כי בכל קבוצה לא לכל הפרטים יש אותה רמת הצלחה. תצפית על מהלכיו של הפרט המצליח עשויה להעלות את הצלחתו של הצופה. מכיוון שהצלחה היא רב-ממדית, לחברים רבים בקבוצה יש יתרון במימד זה או אחר בשילוב עם נחיתות בממדי ההצלחה האחרים. יתרונות כאלה עשויים לנבוע מההתנהגות שלהם כלפי פרטים אחרים, בכלים שבהם הם משתמשים לביצוע פעולות מסוימות, בזמנים ובמקומות שהם בוחרים לביצוע פעולות אלו וכו'. אם כל חבר בקבוצה ישמור על אותם חלקים בהתנהגותו הנראים קשורים להצלחתו יחסית לאחרים במימד שבו הוא מוביל, ויחקה את התנהגותם של פרטים אחרים בקבוצה באותם תחומים שבהם הוא עצמו נחות, תגיע כל הקבוצה לרמות גבוהות של יכולת - רמות שקשה מאד יהיה להגיע אליהן ללא החיקוי.

תיאור זה לוקה בהפשטת-יתר לא רק עבור בני אדם אלא גם עבור יצורים פשוטים בהרבה. ראשית, לעתים קרובות הפתרון ה"נכון" הוא שרירותי ואינו נובע ישירות מעובדות החיצוניות לקבוצה, אלא תלוי בהסכמה של כל הקבוצה. דוגמה קיצונית לכך היא צד הכביש שבו נוהגים: למרות ויכוחים תכופים בין ילידי אנגליה לבין ילידי אירופה היבשתית, קשה להצביע על יתרון עובדתי לנהיגה בצד שמאל מול נהיגה בצד ימין, ולהיפך. למרות זאת, יש יתרון ברור לנהיגה בצד ימין אם כל הנהגים האחרים עושים כך. שנית, חיקוי עשוי להיות מזיק, כמו למשל כאשר מקצוע מסוים זוכה להצלחה וגורם לאנשים רבים מדי לרכוש לעצמם אותו מקצוע. תהליך זה גורם בדרך כלל לירידת הדימוי והרווחיות של המקצוע שהיה כה מבוקש. במקרה הקיצוני של חיקוי מושלם, יפעלו כל האנשים באותה צורה, וסביר כי בצורה זו אף אחד מהם לא יזכה להצלחה רבה. זוהי אחת הסיבות לתחושה האינטואיטיבית נגד חיקוי: הוא פועל נגד הנטייה להתמקצע ולהתמחות, הידועה לכלכלנים כתנאי להעלאת הפריון.

פשטנות מוצלחת

בשנת 1995 פרסמו מדען המחשב ראסל אברהרט (Eberhart) והפסיכולוג ג'יימס קֶנדי (Kennedy) שיטה לסימולציה של התנהגות חברתית המבוססת על שילוב של חיקוי עם גילוי עצמאי. הם קראו לשיטה PSO, ראשי תיבות של Particle Swarm Optimization (אופטימיזציה על ידי נחיל חלקיקים). שיטה זו שימשה מאז בהצלחה גם לאופטימיזציה - מציאת פתרונות רבי-ערך לבעיות קשות - וגם כמודל פשוט לניתוח התנהגות חברתית של יצורים חיים.

במבט ראשון, PSO מזכירה שיטות אופטימיזציה ידועות אחרות, כמו אלגוריתמים גנטיים או אופטימיזציה על ידי מושבות נמלים (ACO - Ant Colony Optimization). בכל אלה, המחשב מדמה מספר רב של פרטים באוכלוסיה. כל פרט מייצג פתרון אפשרי לבעיה, או כמה פתרונות הנוצרים על ידי אותו פרט תוך התקדמות הסימולציה. הפתרונות הטובים ביותר המתגלים בכל שלב משמשים כבסיס לחיפוש פתרונות בשלב הבא: באלגוריתמים גנטיים הפתרונות נוצרים על ידי הכלאה של פתרונות מהדור הקודם והוספת "מוטציות", וב- ACO הפתרונות נוצרים על ידי כך שפרטים עוקבים אחרי "שבילי הריח" שהותירו פתרונות טובים על מפת הפתרונות האפשריים, אך מסיירים גם במרחק-מה משבילים אלה.

בבסיסה של PSO נמצאת צורה אחרת של השבחה הדרגתית של פתרונות, המבוססת על חיקוי. בניגוד לאלגוריתמים גנטיים, שבהם אין כל תקשורת בתוך האוכלוסייה פרט לזו המעבירה חומר גנטי לדור הבא, ב- PSO קיימת תקשורת תוך כדי מהלך ה"חיים" של פרט אחד. בניגוד ל- ACO, שבה התקשורת נעשית על ידי חיזוק או החלשת מסלולי פתרון על ידי שינוי ה"ריחות" שכל פרט משאיר על המסלולים, ב- PSO התקשורת היא ישירה בין פרטים ספציפיים. העיקרון הבסיסי הוא כי כל פרט משווה את הפתרון הטוב ביותר שמצא לפתרון הטוב ביותר שמצאו פרטים אחרים שאיתם יש לו קשר, ומתקן את מצבו לפי השוואה זו: אם הוא מחזיק בפתרון הטוב ביותר, ה"תיקון" יהיה קטן יחסית וכך יוכל לנסות פתרונות הדומים מאד למצבו העכשווי - ייתכן שיש מקום לשיפורים קלים. אם פרט אחר מחזיק בפתרון טוב יותר, התיקון יהיה גדול ובכך יהיה דומה לתופעת החיקוי בחברות אנושיות.

התנהגות חברתית כמסלול במרחב

המודל של אברהרט וקנדי מורכב רק במעט יותר מעיקרון זה, ובנוי על הגדרה מתמטית של מרחב הבעיה ושל מסלולים במרחב זה. נבחן לדוגמה חיפוש אחר צורה אידיאלית לאנטנת שידור. צורת האנטנה מוגדרת על ידי סידרת מספרים המבטאים, למשל, את מיקומו וגודלו של כל אלמנט של האנטנה. סידרת מספרים זו ניתנת לתיאור כמרחב מתמטי רב-ממדי. כל צורה אפשרית של אנטנה היא נקודה בתוך המרחב. כל "חלקיק" במודל מאופיין על ידי מיקומו במרחב - מיקום הניתן לתרגום לצורה מסוימת של אנטנה. הוא מאופיין גם על ידי מהירותו במרחב, כלומר קצב השינוי של מיקומו. גם המהירות היא סדרת מספרים, באותו אורך של סידרת המספרים המתארת את המיקום: לא כל מימד משתנה באותו קצב (כלומר - המיקום והמהירות הם וקטורים). כל חלקיק שומר בזיכרונו עוד שני נתונים: "השיא האישי" - הפתרון הטוב ביותר שהחלקיק עצמו מצא מאז תחילת הסימולציה, ו- "השיא הקבוצתי" - הפתרון הטוב ביותר שמצאו החלקיקים האחרים שנמצאים ב"סביבתו" (עוד על הסביבה בהמשך).

בצעד הראשון של כל שלב בתהליך האופטימיזציה, כל חלקיק מחשב את טיב הפתרון שאליו הגיע בסוף השלב הקודם. במקרה של תכנון אנטנה, טיב הפתרון יחושב על ידי פתרון משוואות הפצת גלים אלקטרומגנטיים והשוואת התפלגות האנרגיה הנקלטת מסביב לאנטנה להתפלגות הנדרשת (לעתים קרובות נדרשת אלומת שידור כיוונית, כלומר ריכוז האנרגיה בכיוון מסוים ומינימום שידור לכל כיוון אחר). טיב זה מושווה מול טיב השיא האישי והשיא הקבוצתי. בהתאם להשוואה זו תעודכן מהירות החלקיק: אם איכות הפתרון כרגע נמוכה יחסית לשיאים אלה, מהירות השינוי תהיה גבוהה, ולהיפך. כל חלקיק נותן משקל מסוים גם לשיאו האישי, אפילו אם שיא זה נמוך בהרבה מהשיא הקבוצתי, כדי לשמור על מידה של "אינדיבידואליות" ולמנוע מצב שבו כל החלקיקים עוברים בדיוק באותם מסלולים. חזרה על אותם מסלולים מבזבזת לריק את כוח החישוב ללא תרומה לאיכות הפתרון.

ליתר דיוק, ההשוואה מול השיאים הידועים מעדכנת לא את המהירות עצמה אלא את קצב השינוי במהירות, כלומר - את התאוצה. משמעות הדבר היא כי גם חלקיק שהגיע לפתרון מעולה אך מהירותו הייתה גבוהה לא יעצור במקום, אלא יקטין את מהירותו, ולכן בשלב הבא ימצא את עצמו "בצידו השני" של הפתרון החדש שהתגלה זה עתה. אין בכך נזק: אם התנועה האחרונה הניבה תוצאות טובות, למה לא להמשיך ולנוע באותו כיוון? אם המשך התנועה יביא לפתרונות טובים פחות, בשלבים הבאים ימשיך לשנות החלקיק את מהירותו עד שיהפוך את כיוונה ויחזור אל הפתרון הטוב שכבר נמצא. למהירות זו יש להוסיף גם אלמנט אקראי מסוים כדי לאפשר גילוי של הזדמנויות נוספות לשיפור. בשלב האחרון, מתעדכן מיקום החלקיק במרחב על ידי חיבור המיקום העכשווי עם המהירות החדשה. תיאור תהליך זה במשוואות מתמטיות אפשר למצוא בקישור שבסוף הכתבה.

למודל זה יש כמה תכונות רצויות: ראשית, חלקיקים "נמשכים" אל פתרונות טובים מכמה כיוונים שונים, וכך מגדילים את הסיכוי כי יימצאו פתרונות טובים עוד יותר כשיפור של פתרונות קיימים. שנית, החלקיקים נמצאים בתנועה מתמדת ואינם "ננעלים" על פתרונות שכבר נמצאו. שלישית, המודל הוא פשוט יותר ממודלים אחרים ויש בו פחות פרמטרים לכוונון. תכונה זו מקילה על חוקרים להפעיל אותו בתחומים מגוונים: בין עשרות המאמרים בתחום שפורסמו ב- 2004 בלבד, אפשר למצוא לא רק תכנון אנטנות אלא גם תכנון מיקומם של תאי שידור סלולריים, קירוב של עקומים גיאומטריים על ידי קווים ישרים, "כריית מידע" - כלומר הפקת מסקנות מתוך מסדי נתונים גדולים, תכנון כנף מטוס, החלטה על נקודות קידוח ועוד.

אם נעקוב אחר התנהגות ענן החלקיקים לאורך זמן היא תזכיר תנועה של להקות דגים או עופות: בתוך התנועה הבלתי-פוסקת, חלקיקים בודדים נעים בצורה הנראית כמעט אקראית ושרירותית, אך הענן כולו שומר על אחידות רבה בצורתו ובמהירותו; שינוי בחלק אחד של הענן יכול להיעלם ולהיבלע חזרה ללא השפעה על התנועה הכללית, או לגרום לכל שאר הפרטים בלהקה להעתיק את השינוי ובכך להזיז את כל הענן לכיוון חדש. דמיון זה אינו מקרי - מודל ה- PSO שאב את השראתו בדיוק מהתנהגויות של להקות.

סכנות התקשורת המושלמת

בהשוואה לאלגוריתמים גנטיים, שבהם אין תקשורת בין פרטים, ולאופטימיזציה על ידי מושבות נמלים (ACO), שבהן התקשורת היא עקיפה, PSO מכניס לתמונה תקשורת ישירה בין פרטים באוכלוסיה. לעתים קרובות שיפור התקשורת אכן מביא לפתרון טוב יותר של בעיות, אך הוא גם עלול לגרום לאותם נזקים המוכרים אצל בני אדם כאשר החיקוי משתלט על ההתנהגות האופיינית בחברה . ב- PSO, נזקים אלה מתבטאים ב"נהירה המונית" של כל החלקיקים אל פתרון באיכות סבירה שהתגלה בשלב מוקדם, כך שחלקים נרחבים של מרחב הפתרונות אינם נבדקים על ידי אף חלקיק. אחת מהדרכים להתמודד עם בעיה זו היא צמצום התקשורת. בתיאור המודל הוזכרה ה"סביבה" של כל חלקיק. זוהי רשימת החלקיקים שרק איתם יכול החלקיק לתקשר ולהעביר מידע על פתרונות טובים הידועים לו או להם. אם כל חלקיק קשור לכל האחרים, התקשורת היא מושלמת ומיידית. אם נגביל את גודל הסביבה, עדיין יכול כל חלקיק לקבל בסופו של דבר מידע על כל חלקיק אחר, על ידי העברה בכמה שלבים, דרך שרשרת של "שכנים". קיימות אפשרויות רבות להגבלת התקשורת. נזכיר שתיים השונות מאוד זו מזו: בראשונה, נחשוב על החלקיקים כאילו הם מסודרים במעגל, כאשר כל חלקיק מעביר מידע רק לשני שכניו, מימינו ומשמאלו. בסידור זה, "השיא הקבוצתי" הוא התוצאה הטובה ביותר שאליה הגיע החלקיק הזה או אחד משני שכניו. אפשר לחשוב על סידור כזה כדומה לתקשורת בחברה קדם-תעשייתית. בשנייה, התצורה היא "תצורת כוכב" בה כל החלקיקים מעבירים מידע אל ומאת חלקיק אחד: חלקיק זה מקושר לכל האחרים, וכל חלקיק אחר מקושר רק אליו. תצורה זו מזכירה את מעמד ה"ידוענים" או מובילי האופנה בחברה המודרנית. ברור כי בתצורה השנייה הפצת המידע הרבה יותר מהירה, אך גם בה הפצת המידע מוגבלת יחסית לחיבור מלא.

דווקא איטיות ההפצה של מידע על ממצאים "טובים" היא המאפשרת הטרוגניות של פתרונות טובים וסקירה של אפשרויות רבות ושונות זו מזו, תוך כדי הפריה הדדית מבוקרת. אפשר למצוא בכך הד לטענותיהם של המתנגדים לגלובליזציה, שלדעתם גורמת לאחדות תרבותית מזיקה ומדכאת את הסיכוי להתפתחות תרבויות וחברות טובות יותר מאלה שכרגע הגיעו לדומיננטיות עולמית - כלכלית ותרבותית.

למרות שאין להגזים בחשיבות של מודלים פשטניים כאלה כמלמדים על מורכבות החברה האנושית, ספקולציות כאלו משרתות את מטרתם השנייה של אברהרט וקנדי - לא רק פתרון בעיות הנדסיות, אלא גם חקירת מודלים פסיכולוגיים וסוציולוגיים. בהקשר זה מעניין לציין את אחד השימושים הראשונים של PSO, שהוזכר כבר במאמר המוקדם המובא בקישור שבסוף הכתבה. שימוש זה הוא קביעת משקלים לקישורים בתוך רשת תאי עצב (Neural Network). רשתות כאלו הן מודלים מתמטיים לחישוב המבוססים על הפשטה של פעולת המוח: פעילות תא עצב אחד מחזקת או מדכאת פעילות תא עצב אחר, לפי משקל חיובי או שלילי של הקשר בין שני התאים. רשתות כאלו התבררו כמוצלחות ביותר עבור מגוון עצום של שימושים, אך האתגר של קביעת המשקלים הוא לעתים קרובות בעייתי. קנדי ואברהרט הראו כי PSO מאפשר קביעת משקלים בצורה המשתווה או טובה יותר משיטות אחרות של למידה. מכך - עם כל הזהירות המתבקשת - אפשר להציע מודל קוגניטיבי של למידה על ידי שינוי הקישורים הפנימיים בתוך המוח, כאשר שינויים אלה מודרכים על ידי השוואת ההצלחה מול הצלחתם של מוחות אחרים. מודל זה אינו מתאים כפשוטו לתיאור למידה ביולוגית - בין השאר, בחיי היום-יום איננו יכולים למדוד ישירות את חוזק הקשרים בתוך מוחנו או במוחות אחרים - אך הוא כבר מתאים ללמידה בבינה מלאכותית, ואולי הוא יכול "להחזיר את הטובה": לשמש השראה ל"מדעים הרכים" כפי שאותם מדעים שימשו השראה ליצירת ה-PSO.

קישורים
http://www.swarmintelligence.org - אתר המרכז מידע על בינת נחילים
http://www.engr.iupui.edu/~shi/Coference/psopap4.html
- תיאור מודל ה- PSO

ביבליוגרפיה:
כותר: בינת הנחיל
מחבר: בנימיני, ישראל
תאריך: ינואר 2005 , גליון 77
שם כתב העת: גליליאו : כתב עת למדע ומחשבה
הוצאה לאור: SBC לבית מוטו תקשורת ולאתר IFEEL
הערות לפריט זה: 1. ישראל בנימיני עובד בחברת ClickSoftware בפיתוח טכנולוגיות אופטימיזציה מתקדמות.
הספרייה הוירטואלית מטח - המרכז לטכנולוגיה חינוכית