הסדרי נגישות
עמוד הבית > טכנולוגיה ומוצרים > מחשבים ואינטרנט
אינטרנט עכשיו : מגאזין לאתרי אינטרנט בארץ ובעולם



תקציר
מידע על הפקת המירב מאתרי האינטרנט, שהגישה אליהם נעשית באמצעות הדפדפן (Browser): מנגנונים לחיפוש מידע, טיפים לחיפוש ממוחשב, האינדקס המקוון, מנוע החיפוש, חיפוש מידע בישראל, שלבי עבודת החיפוש וכתובות אתרים בנושאים הללו.



למצוא מחט בערימת שחת
מחבר: ליאור עילם


אם תשאלו שלושה גולשים "האם יש באינטרנט מידע המעניין אותך?", סביר שתקבלו שלוש תשובות שונות: אין שם כלום; יכול להיות שיש מידע שמעניין אותי אבל אני לא יודע איך להגיע אליו; יש המון מידע שמעניין אותי אך אינני יודע לאן לגשת קודם.

ובכן - כל אחד יכול ללמוד טכניקות חיפוש בסיסיות שיסייעו לו לברור את המידע המבוקש מהרשת. כמו בכל מיומנות, אם תאמצו שיטת עבודה מסודרת ותפיקו לקחים, יכולתכם לאתר מידע ביעילות ובדייקנות תלך ותשתפר עם הזמן.

אין זה משנה מה תחום העניין שלכם, קרוב לוודאי שבאינטרנט קיים מידע רב אודותיו. חלק גדול של המידע נמצא בעשרות מיליוני האתרים שברשת. הללו מכילים, כל אחד, בין דף מידע אחד ועד עשרות אלפי דפים. חלק נכבד נוסף מהמידע ברשת נמצא ברשימות דיוור, בקבוצות דיון ובמאגרי מידע שהגישה אליהם בתשלום. כמו כן, מאפשרת הרשת למצוא גם מספרי טלפון, כתובות, תיבות דואר אלקטרוני ותוכנות להורדה. בכתבה זו אתרכז בהפקת המירב מהמשאב הנגיש והמוכר לכולנו: אתרי האינטרנט, שהגישה אליהם נעשית באמצעות הדפדפן (Browser) שלנו. שאר מקורות המידע יזכו להתייחסות נפרדת בעתיד.


 

מנגנונים לחיפוש מידע


מאחר וכמות המידע ברשת כה גדולה, נוצר צורך ליצור כלים שיקטלגו את האתרים ודפי המידע המאוגדים בהם ויסייעו לכל אחד למצוא ברשת את מבוקשו. שני הכלים המרכזיים לאיתור מידע ברשת הינם מנוע החיפוש והאינדקס (מדריך) המסווג.

מנוע החיפוש פועל באמצעות תוכנה הקרויה "רובוט" (או "תולעת"). תפקידה הוא איסוף מידע מדפי מידע באינטרנט וקיטלוגם על פי פרמטרים קבועים. הרובוט קובע אילו מילים יתארו כל דף מידע באופן הטוב ביותר - לרוב תוך התחשבות בתיאור שהעניק יוצר דף המידע ובעזרת פרמטרים נוספים כגון "מהן המילים אשר מופיעות בדף המידע בתכיפות הגבוהה ביותר". כך, למשל, אם "הרובוט" החליט שדף מידע מסוים מתואר באופן הטוב ביותר על ידי המילים Artificial Intelligent (אינטליגנציה מלאכותית), הרי רב הסיכוי שכאשר תקישו צמד מילים זה במקום המיועד לכך בדף הפתיחה של מנוע החיפוש, יהיה אותו דף מידע מסויים בין הראשונים שמנוע החיפוש יציע לכם לבקר בו, בכדי למצוא את המידע הרלוונטי.

האינדקס המסווג אינו משתמש בתוכנה "רובוטית" בכדי לאפיין את דפי המידע. תפקיד זה מופקד בידיהם של סוקרים אנושים (לעיתים בשילוב עם תוכנת "רובוט"). הסוקרים האנושיים אינם סוקרים דפי מידע באופן אקראי, אלא מבקרים באתר אינטרנט מסויים בכדי לעמוד על טיבו, לאחר שקיבלו בקשה לעשות כן. האינדקסים המקוונים יציגו בפנינו, במרבית המקרים, כתובות לא של דפי מידע, אלא של אתרים שלמים העוסקים בנושא המעניין אותנו. נוכל גם להניח שמאגר הכתובות שבידי האינדקס המסווג איכותי יותר ושנוכל לאתר בעזרתו, ביתר קלות, את האתרים המרכזיים העוסקים בנושא עליו אנו מעונינים לקבל מידע.

אם כך מדוע שלא להשתמש תמיד רק באינדקסים המסווגים? הסיבה לכך נעוצה בכך שהסוקרים, כבני אדם, אינם יכולים להתחרות ביכולת של ה"רובוט" לבקר בכמות עצומה של דפי מידע. ה"רובוט" אינו זקוק לשינה ואינו יוצא להפסקת קפה. הוא סוקר ללא לאות את מרחבי הרשת ויוצר למעננו מאגר עצום של הפניות לדפי מידע. במקרים רבים, היכולת המדהימה של ה"רובוט" תבטיח גם שדפי המידע אליו הוא יפנה אותנו יהיו עדכניים יותר מהאתרים אליהם יפנה אותנו האינדקס המסווג. זאת מאחר והסוקרים האנושיים מוצפים בבקשות של בעלי אתרים לבקר באתר שלהם, עד שאין הם מספיקים לחזור ולבקר באתרים שכבר ביקרו בהם בעבר.

באינדקס המסווג נשתמש, בעיקר, כאשר אנו רוצים למצוא מידע על נושא מוגדר, שקיים עליו מידע רב ברשת. שיטת החיפוש העיקרית באינדקס הינה באמצעות תנועה בעץ הסיווגים, מנושא כללי לנושא ספציפי יותר, עד לאיתור הנושא המבוקש והפניה לאתרים העוסקים בו. שיטה זו תעבוד יפה אם נחפש נושא כגון "קבוצת מנצ'סטר יונייטד", אותה נמצא תחת הקטגוריה של כדורגל הנמצאת בקטגוריה הכללית יותר של ספורט.

במנוע החיפוש נשתמש כאשר נרצה לקבל מידע רב על נושא כלשהו, גם אם הוא מוגדר "שולי" או "לא רציני" על ידי אנשים מסויימים, למשל - על תיאוריות לפיהם הזמר המנוח אלביס פרסלי עדיין בין החיים. בעזרת מנוע החיפוש נצליח, במרבית המקרים, להגיע לפיסות מידע שהיו נסתרות מעינינו אילו הסתפקנו בחיפוש באינדקסים מקוונים בלבד.

החיפוש במנוע החיפוש יעיל במיוחד כאשר נתקשה לקבוע תחת איזו קטגוריה לחפש את הנושא המעניין אותנו. למשל אם אנו מחפשים מידע אודות "תרומת הנשים למדע", נוכל לחפש מידע על נושא זה תחת הקטגוריה של "נשים", "מדע" או "היסטוריה". נושא זה מתאים לחיפוש באמצעות מנוע חיפוש גם משום שהמידע הקיים עליו ברשת אינו רב (יחסית). אנו לא נוצף בעשרות אלפי הפניות לדפי מידע, כפי שהיה עלול לקרות אילו חיפשנו מידע על נושא פופולרי כגון "מחשבי PC".



 

טיפים לחיפוש ממוחשב


לפני שאציג דוגמאות ספציפיות לאיתור מידע באמצעות מנוע החיפוש והאינדקס המקוון, אסביר כיצד נבחר את מילות החיפוש בהן נשתמש וכיצד נבהיר למחשב מהם היחסים שצריכים לשרור בין המילים.

בקשת החיפוש לפי מילים, שנשלח למנוע החיפוש או לאינדקס המסווג, נקראת שאילתה. כאשר נחפש מידע על ראש הממשלה, נקיש את שמו ונקבל רשימת הפניות לאתרים ממשלתיים רשמיים וכן למספר אתרים לא רשמיים, המכילים מידע אודותיו. אולם כאשר נבקש לקבל מידע על נושא מורכב כגון: "תרומת הנשים למדע", עלינו ללמוד כיצד לנסח את השאילתה, בכדי שנקבל מספר רב, ככל האפשר, של הפניות איכותיות.

העיקרון שעל פיו פועל החיפוש הממוחשב הינו קשרים לוגיים (מכונה גם "חיפוש בוליאני"). למעשה מדובר בטכניקה פשוטה למדי שקל מאד להבינה. קשרים לוגיים בין מילים ניצור באמצעות מילות הקישור: AND, OR או NOT. למשל, כאשר נחפש תמונה שבה יופיע פרפר ופרח ביחד נכתוב: butterfly and flower, כאשר נבקש לאתר תמונה שבה יופיע אחד מהשניים, נכתוב: butterfly or flower וכאשר נבקש לקבל תמונה שבה יופיע רק פרפר בלי פרח נכתוב: butterfly not flower.
כך, על מנת לקבל מידע אודות "תרומת הנשים למדע" מבלי לקבל הפניות לאתרי מדע בדיוני למשל (Science Fiction), נרשום: Woman and science not fiction.

מילת קישור שימושית נוספת הינה NEAR, המציינת קירבה בין שתי מילים, כפי שיופיעו בדף המידע. בכדי לחפש אחר ביטוי מדויק, מומלץ להשתמש במרכאות וכך לצמצם את מספר התוצאות, למשל "computer programming". במרבית המקרים מנגנוני החיפוש אינם מתחשבים האם השתמשתם באותיות גדולות או קטנות, למעט המקרים בהם בהם השתמשתם במרכאות.



 

האינדקס המקוון


קיימים אינדקסים מקוונים רבים ברשת. המוכר והפופולרי מביניהם הוא Yahoo. באינדקס המקוון אנו יכולים לחפש בשני דרכים: הראשון הוא לנוע בעזרת עץ הסיווגים מקטגוריה כללית לנושא ספציפי יותר. השני הינו להשתמש במילות חיפוש. החיפוש במילות חיפוש ב- Yahoo יעיל במיוחד כאשר מנצלים את האפשרות לחפש בתוך הקטגוריה הנבחרת. נוכל גם לחפש בכותרות המסמכים בלבד (נקליד T: ואח"כ את מילות החיפוש) או בכתובות המסמכים בלבד (נקליד U: ואח"כ את מילות החיפוש).



 

מנוע החיפוש


קיים מגוון רחב של מנועי חיפוש ברשת. אחד הפופולריים והטובים שבהם הוא Altavista, ובו אתרכז בכתבה זו. כאשר נבקש לחבר שאילתה ב- Altavista נזכור תמיד שברירת המחדל שלו הינה OR, כלומר אם נקליד מספר מילים אחת ליד השניה, שקול הדבר כאילו הקשנו ביניהן את מילת הקישור OR. לכן, כאשר נרצה דפי מידע המכילים מספר מילים (AND) נשתמש תמיד בסימן הפלוס (+). יש לזכור, עם זאת, שבמרבית מנועי החיפוש, ברירת המחדל הינה דווקא AND.

ל- Altavista פונקציה בשם Refine, המאפשרת לקבל רשימה של מילים הקשורות למונחים אותם הקלדנו בשאילתת החיפוש. נוכל להחליט האם הוספת מילים אלו (AND) או שלילתן (NOT) תסייע לנו לשפר את התוצאות שנקבל. את רשימת המילים שאותן נכליל או נסלק מהשאילתה נראה כרשימה (List) או גרף (Graph).

ל- Altavista פונקציות רבות נוספות. כך, למשל, נוכל לחפש אתרים רק בשפה מסויימת (גם בעברית). מומלץ גם ללמוד ולהשתמש ב"חיפוש המתקדם" (Advanced Search), בו ניתן להשתמש בחיפוש בוליאני (את מילות הקישור יש להקליד באותיות גדולות: NEAR, NOT, OR, AND).

Altavista אינו מנוע חיפוש שקל להשתמש בו, בעיקר למשתמש המתחיל, אולם הוא פופולרי מאוד ונחשב לאחד ממנועי החיפוש החזקים ביותר. בכדי לנצל את מלוא היכולות שהוא מציע יש לקרוא את דפי ההסבר. כדי להגיע לדפי ההסבר חפשו את קובץ ה"עזרה" בדף הפתיחה. הוא יוביל אתכם להסבר על האופן בו ניתן לבצע חיפוש יעיל.

דפי ההסבר נמצאים לא רק במנוע החיפוש Altavista, אלא בכל מנוע חיפוש ואינדקס מסווג. הללו מכילים הסברים כיצד נוכל לנצל את אותו מנגנון חיפוש באופן היעיל ביותר ואילו אפשרויות ייחודיות מוצעות לנו כדי לשפר את תוצאות החיפוש. כדאי לשים לב שחלק ממנועי החיפוש (ו- Altavista נמנה עמם), מדרגים את תוצאות החיפוש שלהם על פי מידת הרלוונטית שלהם לשאילתה. על כן, בהנחה שניסחתם את השאילתה בדייקנות, תמצאו בהפניות שקיבלו דירוג גבוה מידע רב על הנושא המבוקש.

מאידך, אם אינכם מוצאים את המידע המבוקש בדפי מידע שזכו על ידי מנוע החיפוש לדירוג גבוה, ייתכן בהחלט שעליכם לנסח מחדש את השאילתה. בנוסף כדאי שנדע כי קיימים מספר מספר מנגנוני חיפוש, המאפשרים לשלוח את השאילתה למספר מנועים בו זמנית. הללו מכונים "מנועי חיפוש מקביליים". נשתמש בהם כאשר נתחיל לחפש מידע על נושא, שכמות המידע הקיימת עליו ברשת נמוכה יחסית. כאשר נחפש באמצעותם מידע על נושא פופולרי נקבל מספר הפניות עצום.



 

חיפוש מידע בישראל


הצורך במנגנוני חיפוש ישראלים נובע משני טעמים עיקריים: הרצון של ישראלים רבים למצוא אתרים ישראלים, הן מבחינת הרלוונטיות שלהם לחברה ולתרבות המקומית והן משום שרובם כתובים בשפה העברית, וכן הקושי של ישראלים רבים לערוך חיפושי מידע מורכבים באנגלית. האינדקסים הישראלים מציעים בעיקר אתרים הכתובים בעברית, או הכתובים אנגלית אך קשורים להוויה הישראלית. חלקם מפנים גם לאתרים נבחרים מהעולם, שלא קשורים דווקא לישראל.

מנועי החיפוש הישראלים מציעים הן חיפוש באתרים בעברית וכן אופציה של חיפוש בכל האתרים הקיימים ברשת, על ידי תרגום מילות החיפוש מעברית לאנגלית. כאשר משתמשים במנועי החיפוש הישראלים בכדי לאתר אתרים בכל העולם, כדאי לזכור שהיכולת להרכיב שאילתות ולשפר את תוצאות החיפוש, נחותה יחסית ליכולת של מנועי החיפוש העולמיים.



 

שלבי העבודה


כל מידען מפתח, במהלך עבודתו, שלבים אותם הוא מוצא כיעילים ביותר בתהליך החיפוש. את העיקרים שבהם ריכזתי כאן:

  • שלב ראשון: עלינו להגדיר את הצורך, כלומר את הנושא המדויק עליו אנו מעונינים למצוא מידע רלוונטי.

  • שלב שני: נבחר את האמצעי באמצעותו נבצע את החיפוש: מנוע חיפוש או אינדקס מקוון.

  • שלב שלישי: נבחר את מילות החיפוש. כאשר נשתמש במילות לועזיות נזכור, כמובן, להקפיד על כתיב מדויק.

  • שלב רביעי: נקבע את הקשרים הלוגיים בין מילות החיפוש, תוך שימוש במילות הקישור והסימנים שציינתי לעיל.

  • שלב חמישי: נבצע את החיפוש ונבחן את התוצאות. אם התוצאות אינן משביעות את רצוננו ננסה לשפרן: אם קיבלנו תוצאות מעטות מדי נוכל להיעזר בתזאורוס (אגרון) כדי למצוא מילים נרדפות למילות החיפוש שלנו ולהוסיף אותן לשאילתה. אם התוצאות שקיבלנו רבות מדי ננסה לצמצמם, למשל על ידי שימוש במילת הקישור NOT.





 

לסיכום


לכל אחד ואחת מאיתנו היכולת לאתר מידע ביעילות, על ידי למידת הכללים הבסיסים אשר באמצעותם נבנית שאילתת החיפוש. לאחר רכישת היסודות נוכל לשפר את יכולתנו באמצעות ניסוי וטעיה וכן בעזרת דפי המידע הקיימים בכל מנוע חיפוש או אינדקס מסווג. נוכל גם לפנות לאתרים שבהם ריכזו למעננו אנשים טובים, מידע על שיטות החיפוש היעילות ביותר ועל המאפיינים היחודיים של מנועי החיפוש והאינדקסים המסווגים הנפוצים ביותר.

כל אחד מאתנו יכול ללמוד טכניקות חיפוש בסיסיות שיסייעו לו לברור את המידע מהרשת. כמו בכל מיומנות, אם תאמצו שיטת עבודה מסודרת ותפיקו לקחים, היכולת שלכם לאתר מידע ביעילות ובדייקנות תלך ותשתפר עם הזמן.


מנועי חיפוש רובוטיים
Altavista: http://altavista.digital.com
Hotbot: http://www.hotbot.com
Search: http://www.search.com

מדריכים (אינדקסים) מסווגים
Yahoo: http://www.yahoo.com
Magellan: http://www.magellan.com
NetGuide: http://www.NetGuide.com

מנועי חיפוש מקביליים
Metacrawler: http://www.metacrawler.com
Askjeeves: http://www.askjeeves.com
Avenue: http://www.avenue.com

אתרים המכילים מידע נוסף על מנגנוני איתור המידע ברשת
אתר למתחילים : http://www.ultranet.com/~egrlib/tutor.htm
Search Engine Watch: .http://www. searchenginewatch.com
אתר מצוין נוסף: http://www.monash.com/spidap.html

אינדקסים מסווגים ישראלים
וואלה: http://www.walla.co.il
תפוז: http://www.tapuz.co.il
סבבה: http://www.sababa.co.il
אחלה: http://achla.co.il
המדריך ה(כמעט) שלם ל- www בישראל: http://www.math.technion.ac.il/~nyh/israel/hindex.html
דפי רשת: http://www.reshet.co.il/data/index.htm

מנועי חיפוש ישראלים
סיבוב: http://www.sivuv.co.il
אתרים: http://www.atarim.co.il

ביבליוגרפיה:
כותר: למצוא מחט בערימת שחת
מחבר: עילם, ליאור
תאריך: לא ידוע 1998 , גליון לא ידוע
שם כתב העת: אינטרנט עכשיו : מגאזין לאתרי אינטרנט בארץ ובעולם
הוצאה לאור: אריג'נט
הספרייה הוירטואלית מטח - המרכז לטכנולוגיה חינוכית