סיפור חייו של פרופסור יעקב שויקה, מומחה בינלאומי למחשבים ולאחזור מידע, שחולל מהפכה בתחום מדעי היהדות , במילונאות העברית ובגישה לטקסטים יהודיים – מעבודתו במודיעין דרך מפעל השו"ת, מפעל מחשוב הגניזה ועוד מפעלים רבים בתחום המחשוב ומדעי היהדות. פרופסור שוויקה לא זכה בפרס ישראל שממש נגזל ממנו, אך זכה להוקרה והערצה של העולם המדעי בארץ ובעולם.
זכיתי להכיר את פרופסור שוויקה לפני כעשרים שנה. ראיינתי אותו ל"מקור ראשון" בלי שהיתה לכך סיבה אקטואלית, אלא מתוך רצון להכירו מקרוב. מאז אותו ראיון נקשרה נפשו בנפשי וכן נקשרו משפחותינו ובעת קריאת שורות אלה אני קורע קריעה. אין בכוחי עכשיו לכתוב את סיפור חייו ואת החוויות הרבות שחוויתי בעשרים שנות הכרות עמו. לכן אני מביא כאן את סיפור חייו כפי שסיפר לי בפגישתנו הראשונה. הדברים ניתנים כאן כפי שנאמרו בשעתם בעדכונים מתבקשים.
[בתחתית הביוגרפיה קישורים למאמרים שפרסמתי במהלך השנים ב"מקור ראשון" ובאתר זה על מפעליו של פרופסור שוויקה ז"ל.]
יעקב שויקה נולד בשנת 1936 בקהיר, אך שורשי משפחתו נטועים בחלב. סבו, יעקב מנחם, ירד מחלב למצרים בתחילת המאה העשרים עם אביו, אהרון, שהיה אז בן עשר. הסב התפרנס ממסחר אך היה תלמיד חכם ועסק בקבלה ובתלמוד. אבי סבו, אהרון, היה רבה הראשי של חלב, באמצע המאה ה-19.
בילדותו למד יעקב שויקה בבית הספר של הקהילה היהודית. כשהגיע לגיל תיכון עבר ללמוד ב"ליסה פרנסה", גמנסיה צרפתית שבה כל הסגל הובא מצרפת. בית ספר מעולה, ברמה מאד גבוהה, במיוחד במדעי הטבע, מתמטיקה ופיסיקה, אבל גם בפילוסופיה ובספרות צרפתית.
במקביל למד שויקה במוסד תורני שייסד אביו, "אהבה ואחווה". מוסד מיוחד במינו – שילוב של בית כנסת, בית מדרש ומרכז קהילתי להפצת תורה. למוסד הייתה השפעה רבה על הקהילה היהודית ובוגריו שנפוצו במדינות רבות, הקימו מוסדות דומים הנושאים אותו שם. האב, בנוסף להיותו תלמיד חכם בתחום היהודי היה רחב אופקים וחובב ספרות עברית. בבית נמצאו כתבי עגנון שיצאו עוד בהוצאת "שטיבל".
שויקה ומשפחתו עלו על האוניה הראשונה של מגורשי מבצע קדש, שעזבה את מצרים והגיעה לארץ דרך נאפולי. כאן כבר נמצאו קרובי משפחה שעלו ארצה עוד בשנות הארבעים והחמישים: שני אחים ודודה.
אהבת המתמטיקה
כשהגיע לארץ החליט ללמוד באוניברסיטה העברית במסגרת העתודה האקדמאית. הברירה הייתה בין כימיה, פיסיקה, ומתמטיקה. "כימיה", אומר שויקה, "לא אהבתי. אבל פיסיקה הבטיחה יותר פרנסה בעתיד. מתמטיקה אמרו לי שנותנת פרנסה רק כמורה או אקטואר בחברת ביטוח. בעצת יצחק אחי (פרופסור יצחק שווה, שהיה בשעתו מועמדו של מנחם בגין לנשיאות) בחרתי מתמטיקה. הוא אמר לי: למד מה שאתה אוהב, פרנסה תבוא כבר. וכך אני גם אמרתי ואומר לשמונת ילדיי".
"זכיתי ללמוד מפי מורים שהיו מאורות גדולים בקנה מידה בינלאומי: אברהם פרנקל, מיכאל רבין, שמשון עמיצור, אברהם רובינסון , אריה דבורצקי, שמואל אגמון ועוד. הייתי מסטרנט אצל פרופסור רבין וסיימתי את הלימודים בהצטיינות".
קריירה אקדמית בצבא
"בתום הלימודים התגייסתי לצה"ל. הוצבתי במודיעין וכאן למעשה החלה הקריירה האקדמית שלי.
"באותה תקופה המחשבים היו בחיתוליהם. מפקד היחידה, סגן אלוף מאיר שפירא, הרבה להתעניין בנושא. קרא, למד ונסע לחוץ לארץ. הוא הסיק שהמחשב יהיה מכשיר מרכזי בשרות חיל המודיעין בעתיד.
"כשבאתי ליחידה החליט שפירא לייעד אותי לתפקיד מיוחד (בנוסף לפעילות השוטפת). לאחר שגמרתי את הקורס הראשון לתכניתנים וכן קורס הצפנה, הטיל עלי לכתוב תכנית מחשב, שתנתח כל מילה עברית מבחינה דקדוקית.
"אנשי היחידה ביקרו את שפירא על התפקיד שהטיל עליי. אמרו לו שזה בזבוז. תשובתו הייתה: בעוד עשר חמש עשרה שנים ימלאו המחשבים תפקיד מרכזי במודיעין. המחשבים יצטרכו להבין את השפה שמבקשים לפענח את הצופן שלה. כיום, אין אפשרות טכנית לעשות את זה בערבית. אם נעשה זאת בעברית, יהיה קל יותר לתקוף את הבעיה אחר כך בערבית. והוא צדק.
"בשנה וחצי סיימתי את המטלה שהוטלה עליי. עם סיומה נמסרו להקלדה שמונים עמודים מתוך "ימי ציקלג" של ס.יזהר. המחשב עשה ניתוח מורפולוגי של הטקסט והכין קונקורדנציה מלאה, ממוינת לפי שורשים. הוכחנו שהרעיון ניתן ליישום ופרסמנו מאמר בכתב העת "לשוננו".
"לאחר השחרור סיימתי את הדוקטורט באוניברסיטה העברית אצל פרופסור רבין והתחלתי ללמד בבר אילן. עברתי את המסלול ממדריך ועד פרופסור מן המניין.
פרויקט השו"ת
"את פרויקט השו"ת ייסד פרופסור אביעזרי פרנקל ממכון ויצמן והוא עמד בראשו משנת 66 ועד 73. אביעזרי הבין שכדי להצליח במשימה יש לבנות, בין היתר, מנגנון להבנת המלה העברית וניתוחה. הוא גייס אותי עם תחילת הפרויקט והציע לי לפתח אלגוריתם מתאים, כחלק מהמערכת הממוחשבת המתוכננת.
"זו היתה עבודה חלוצית בתחום מדעי הרוח, והיא היתה חיונית לפיתוח מנוע לאחזור מידע".
"בזמנו, כולם התנגדו לפרויקט. המשתמשים הפוטנציאליים הטבעיים, הרבנים ותלמידי החכמים, התעלמו ממנו וסרבו בתוקף להעזר בו. ולא פחות מהם אנשי האקדמיה מתחום מדעי המחשב. אמרו שזה שיגעון. אבל אביעזרי ואני התעקשנו והמשכנו בעבודה כשהמימון בא ממקורות שונים.
"ביזבוז כסף וזמן".
"בשנת 1973 החלטנו לפנות לבר אילן ולבקש מימון. האוניברסיטה הקימה ועדה של שלושה פרופסורים מכובדים לבדוק את הנושא. הוועדה הגישה דוח קטלני שקבע: זה בזבוז כסף וזמן. לעולם זה לא יעבוד. למזלנו הרקטור, פרופסור מנחם צבי קדרי (נשיא האקדמיה ללשון העברית- בעת כתיבת הראיון), תמך בפרויקט והאמין בו. לקראת ישיבת הסנאט, שאמורה הייתה להחליט בנושא, הוא מסר לנו את המועד ואנחנו ישבנו עד שעה 3 לפנות בוקר כדי להגיב על הדוח של הוועדה. קדרי הצליח להעביר את רוע הגזירה ולהביא להחלטה חיובית בעניין.
בשלב מסויים החליט מכון ויצמן לוותר על השתתפותו בפרויקט ואני עמדתי בראשו משנת 1974. ב-1986 הושלם גרעינו העיקרי של הפרויקט והוא היה מוכן לפיתוח כמוצר מסחרי.
כך נולד המילון
"באמצע שנות השמונים פנו אלי מן המרכז לטכנולוגיה חינוכית (מט"ח) ואמרו לי: אנחנו רוצים שהמחשב יידע לטפל בעברית מה אתה מציע. אמרתי כי לדעתי יש להתחיל בפיתוח מנתח *מורפולוגי" לעברית.. בסוף שנת 1988 חתמתי עם מטח הסכם לפיתוח המערכת לניתוח מורפולוגי. אחרי חצי שנה המפתח היה מוכן.
"בהמשך ביקשו אנשי מטח להסתייע בנו בהוצאה לאור של מילון ממוחשב לילדים. אמרתי להם: בואו תחילה נעשה מילון חדש לשפה העברית בת זמננו, ממנו נוכל לגזור אחר כך מילון לנוער.
"הצעתי תכנית לשלוש שנים למפעל רב הקף למחשוב חכם של השפה העברית אשר יכלול מילון ממוחשב, תכנה לניקוד אוטומטי תוכנה לעיבוד צרופי לשון, בודק כתיב חסר ומלא למעבדי תמלילים ועוד.
"במטח הביעו אמון בתכנית והיו מוכנים להשקיע את הכסף. קבענו לוחות זמנים מדויקים ואבני דרך. כשספרתי לאשתי, אמרה לי: אתה משוגע? אתה רוצה שנשלם קנס על אי עמידה בחוזה? אנשים לומדים ניקוד שנה שלמה באוניברסיטה ובסוף רובם לא מצליחים. ואתה מבטיח תוכנה שתעשה זאת אוטומטית?. השבתי לה: אני עצמי אמנם לא נקדן מי יודע מה, אבל אני משוכנע שאפשר לפתח אלגוריתם שיעשה את זה. ואז התחלתי לגלגל את הרעיון למילונאות חדשה.
מילונאות חדשה
"משך שנים עקבתי אחר הנעשה בנושא זה בעולם. בעשרים השנים האחרונות עברה המילונאות בעולם מהפכה עמוקה, בהשפעתו המכרעת של המחשב. אנשי המחשבים הפכו שותפים מלאים בעיצובו של המילון. ניתנו תשובות חדשות, שימושיות ומדויקות על השאלות הבאות: מה זה בעצם מילון; מהי הפילוסופיה המבנית שמאחוריו; אלו ערכים (כניסות) הוא צריך לכלול; מהו המידע שיתלווה לערכים אלה; מה הן המשמעויות השונות ומהו בדיוק ה"הסבר"; כיצד יש לצרף דוגמאות שימוש, ועוד.
"התפיסה המודרנית אומרת שהמילון צריך להיות מתאר ולא נורמטיבי. היינו: הוא יכלול את כל השפה החיה, הכתובה והמדוברת, תקנית ולא תקנית כאחת, (כמובן תוך ציון התקניות והמשלב של כל מלה). דבר שני, וזה ההבדל העיקרי: אתה צריך להסביר את המלה, תוך פירוט ומיצוי כל משמעויותיה. עד לשנות השבעים כל המילונים זלזלו בזה, או שלא עמדה לרשותם היכולת הטכנית לממש זאת. ההנחה הייתה שמי שמכיר את המלה מבין אותה. הם הסתפקו בעיקר בדוגמאות מן הספרות ומן המקורות, שבעצם תיעדו את המילים ולא תמיד הסבירו. ב"רב מילים" ההסבר הוא על פי ההקשר שבו מופיעה המלה בטקסטים שבבסיס הנתונים של המילון".
בין חום לטמפרטורה
המילונאות העברית הקלסית היתה מילונאות היסטורית (דיאכרונית) למדנית, מתעדת. התפיסה המילונאית החדשה היא *מילונאות סינכרונית, מדגימה ולא מתעדת, מתארת ולא נורמטיבית. כך, למשל, מגדיר אבן שושן (הישן) את המלה חם בהגדרה הבאה: "בעל טמפרטורה גבוהה, פחות או יותר". ומביא דוגמאות מביאליק ומספר יהושע. המילון של שויקה מבחין בין מרק חם (שהוא בעל טמפרטורה גבוהה) לבין מעיל חם (שמבודד מקור) ומונה שורה של משמעויות נוספות לתיבה חם: גבול חם, ידיעה חמה, אדם חם (כי יש לו חום ממחלה) ואדם חם (כי הוא מסביר פנים), או שהוא בעל מזג חם, ויש גם צבע חם וקול חם, ומשחק ילדים חם חם חם, ואדם מרוגז על מישהו (חם עליו) ואדם הנמשך לאשה כלשהי (חם עליה). כל זה אי אפשר להכין בשיטתו של אליעזר בן יהודה (מלים מלים הוא בדה מלבו הקודח – אומר הפזמון של ירון לונדון). כדי להכין מילון החושף את כל המלים וצרופי המלים שבשימוש יש צורך בקורפוס של מיליוני מילים, הלקוחות מתוך הספרות החיה והעיתונות.
מאה שנות אדם
מפעל הענקים הזה של המילון הממוחשב (כולל הגרסה של המילון לצעיר) הושלם בזמן שיא של כארבע שנים. הנתון הזה עשוי להטעות כי זו לא עבודת יחיד. צוות גדול של מומחים ושל משוגעים לדבר גויס לעבודה, בניצוחו של שוויקה, ובסיועה הפעיל ("והבלתי יסולא בפז") של אשתו, שרה. היא היתה אחראית לכל המנהלה המורכבת של העריכה, ההגהה, האיורים וההפקה, כולל כוח אדם וניהול התשלומים.
סך הכל של זמן וכשרון שהושקעו במפעל כולו מסתכמים בכמאה שנות אדם. אולי יותר מן השנים שהשקיעו בן יהודה ואבן שושן גם יחד במילוניהם.
בסוף שנת 1992 היתה בידי "מטח" הגרסה הראשונית של המילון הממוחשב העברי הראשון. אבל המילון כולו היה אצור בזיכרון של המחשב. כדי להפכו שווה לכל נפש היה צריך להוציאו בגרסה מודפסת.
שלושה שותפים
למשימה הגדולה הזו, שחייבה השקעה של למעלה מחצי מיליון דולר, נרתמו בשותפות רשת סטימצקי, מטח והוצאת הספרים של ידיעות אחרונות עם ספרי חמד. הם התנו את השקעתם בכך ששוויקה יגיש להם פלטות מוכנות להדפסה. שוויקה הפשיל שוב שרוולים, הקים צוות מומחים ומשוגעים לדבר ותוך כמה שנים הגיש את המוצר המוגמר. ליתר דיוק כמה מוצרים – המילון רב מלים המודפס, אליו צורף תקליטון שכלל בנוסף למילון עצמו גם מפתח לניתוח מורפולוגי, ניקוד המלה ונטיותיה, המשפחה אליה שייכת המלה, צירופים וכדומה. במקביל יצאו גם מילון לילדים ומילון לתלמיד ומעבדת מלים אלקטרונית בכף היד.
כישלון בשיווק
אפשר היה לצפות שצרוף רב עוצמה כזה של מו"לים עם מוצר כזה שאין לו תחרות, יכבשו את השוק ויהפכו את "רב מלים" למילון העברי האולטימטיבי. לא כך קרה. לאחר כמה שנים הלך המילון ונעלם מן המדפים ומן התודעה.
מה הסיבה? לאלוהי הרייטינג פתרונים. שוויקה אומר כי המו"לים לא השקיעו את המאמץ המינימלי הנדרש בחשיפת המוצר ובעיצוב המותג. נדמה היה כי המפעל הענק הזה נידון לגניזה.
מילון בעידכון יומי
המפעל לא ירד לטמיון. חברת "מלינגו", חברה בת של אנציקלופדיה בריטניקה, רכשה את המידע הממוחשב ובמסגרת האתר שלה באינטרנט החלה לספק שרותי מילונאות עברית מעודכנת. זהו המילון היחיד בשפה העברית שרשימת הערכים שלו אינה חתומה אף פעם. מדי יום הוא מתעדכן – מוסיפים וגורעים ערכים. בנוסף לכך הוא מספק מכלול שרותים: תזארוס (מלים נרדפות או קרובות משמעות), צרופים, מילים מתחרזות , ניתוח דיקדוקי ותרגום לאנגלית. דומני שאפשר לומר בלי להסתכן שלמרות הכל נכונו למפעל הזה עתידות.
חידת הפרשנים
שאלתי את פרופסור שוויקה: איך אתה מסביר פרשן כמו רש"י שבלי מפעל השו"ת משייט בים התנ"ך והתלמוד כאילו היה אגם קטן.
הוא השיב: "אני אוסיף לך פליאה על פליאה. אני לומד עם ידידים וקרובי משפחה את פירושו של ר' סעדיה גאון (רס"ג) על איוב, הכתוב בערבית-יהודית. והנה רס"ג אומר לנו: המילה הזו, לדוגמא, מופיעה באיוב שלוש פעמים ובתנ"ך תשע פעמים: פה, פה ופה. וזה הפרוש שלה. ריבון העולמים איך הוא יודע? וללא קונקורדנציה ומחשב.
הרב עובדיה יוסף ניצח את המחשב
"אני מכיר את הרב עובדיה יוסף עוד ממצרים, שם למדתי אצלו. בתחילה אף הוא היה מאד סקפטי לגבי מפעל השו"ת. הזמנתי אותו וכשעמד ליד המדפסת הדפיס המחשב את כרך ד' של ספר השו"ת שלו, "יביע אומר", בכמה דקות. עשינו תחרות בינו ובין המחשב באזכור מקורות בנושא מסוים והוא גבר על המחשב. הוא באמת אינו זקוק למפעל השו"ת.
"עיר של חכמים"
הסופר חיים סבתו הוא בן אחותו של פרופסור יעקב שויקה. בספרו "אמת מארץ תצמח" הוא כותב על סבו, אביו של שויקה, ועל חלב ויהודיה:
"ארם צובא עיר של חכמים וסופרים הייתה. ומיוחדים חכמיה בעומק גאוניותם ובחריפות שכלם. חכם חלבי שונא פלפול של הבל ואוהב סברה ישרה, ממעט בדיבור ומרבה בשתיקה. לשונו קצרה וחדה, קפדן בלבושו וקפדן בכבודו. חורז פנינים בדרוש ואמיץ בפסק הלכה. תקיף ואינו נושא פנים לאיש. …
עברית מול אנגלית
עברית היא לכאורה שפה ענייה מול האנגלית. בעברית 4000 שורשים בלבד מול 40 אלף "גזעים" באנגלית. מספר הערכים (כניסות) במילון עברי כארבעים אלף ובאנגלי כמאה וחמישים אלף.
לעומת עוני זה בשורשים ובכניסות, עשירה העברית מאד בפיתוחיה. העברית כוללת לא פחות מחמישים מיליון מחרוזות תקינות.( מחרוזת מוגדרת בבלשנות חישובית: רצף אותיות כלשהו בעל משמעות בשפה). זאת, לעומת מיליון מחרוזות בלבד באנגלית.
לדוגמא: המלה העברית וכשיכוהו זקוקה לשש מלים אנגליות לתרגומה:
and when they would ,will hit him.
והפועל הבסיסי hit אינו משנה את צורתו.
איך נבחר הגופן
הגופן סלעית בו מודפס "רב מלים" נבחר לדברי פרופסור שויקה לאחר שיקול, אך גם בלית ברירה. נעשו ניסויים בכל הגופנים שהיו זמינים במחשב שמספרם ב-1993 היה קטן מאד.
מערכת המילון ביקשה גופן שיהיה אחיד לכל סוגי הטקסט בו ויחד עם זאת ייתן חזות ויזואלית שונה ומאבחנת בין סוגים שונים של מידע : הערך, ההסבר, הדוגמאות, הצרופים והניבים וכו'. הוחלט לבחור בגופן סלעית (שעוצב אז על ידי שמואל סלע) שיש בו גירסאות שונות כמו מוטה, מודגש, דק וכדומה. כל זה היה בלתי אפשרי בגופן פרנקריהל.
מונחים במאמר ופרושם במילון רב מילים
*חלב= "עיר בצפון מערב סוריה והיא העיר השניה בגודלה במדינה. הקהילה היהודית בחלב היא מהעתיקות בעולם. נקראת בפי היהודים ארם צובה".
*אלגוריתם = " סידרה של פעולות קבועות הניתנות לביצוע מכאני (למשל על ידי מחשב) לפתרון בעיה נתונה".
*אחזור= "איתור פריט נתונים והעברתו לפלט או למדפסת".
*מורפולוגיה = בבלשנות – ענף העוסק בחקר יחידות המשמעות הקטנות ביותר בלשון ובצירופיהן. תורת הצורות בעברית.
*מילונאות סינכרונית = "שקשורה למצב הלשון בנקודת זמן מסויימת".
========================================
הפרויקטים של פרופסור שויקה
פרופסור שויקה עמד בראש, או היה מעורב בצורה פעילה בכתריסר פרוייקטים גדולים בתחום המחשוב ואלה הבולטים שבהם:
• בשנים 1962 – 1965 פיתח שויקה את המנתח המורפולוגי הממוחשב הראשון לשפה העברית.
• בשנת 1966 הצטרף לפרויקט השו"ת באוניברסיטת בר-אילן – מהפרויקטים הראשונים והמקיפים ביותר בעולם לאחזור מידע בטקסט מלא, ובשנים 1974 – 1986 עמד בראשו.
• ב-1974 ייסד בבר אילן את המכון לאחזור מידע ומכון לבלשנות חישובית. בין היתר יזם מאגר מבע לעברית בת זמננו הכולל 25 מיליון מילים מן הספרות ומן העיתונות, הרדיו ודברי הכנסת.
• בשנים 1983 – 1985 היה יועץ ראשי למחשוב למערכת האנציקלופדיה העברית, והיה אחראי על ההפקה הממוחשבת של כרך המפתח.
• בשנים 1988 – 1996 היה החוקר הראשי של פרויקט 'רב-מילים' לבלשנות חישובית עברית ומילונאות אלקטרונית של המרכז לטכנולוגיה חינוכית ואחראי לפיתוח סדרת מערכות ממוחשבות לטיפול ממוחשב מתקדם בעברית בהן מילון ממוחשב, נקדן טקסט, מערכת לניתוח מורפולוגי ועוד. הוא ראש המערכת של סדרת מילונים חדשים לעברית המודרנית: 'רב מלים' – המילון השלם לעברית החדשה.
• מאפריל 2005 עומד בראש המחשוב של פרויקט פרידברג לגניזת קהיר. מטרת הפרויקט היא ליצור מאגר מידע שיכלול את כל דפי הגניזה ואת כל המחקרים והפענוחים שפורסמו בנושא במהלך השנים ולאפשר גישה אליהם דרך האינטרנט.
• תרם ידע לגופי ביטחון ומודיעין
• יזם ארגן תיכנן ועמד בראש מחשוב ארכיון ידיעות אחרונות. כתוצאה ניתן להגיע במחשב לכל אחד מדפסי העיתון וגם לאתר כל מילה בטקסטים שנדפסו.
על עבודתיו זכה במספר פרסים, בהם פרסי איל"א ופרס ראש הממשלה לתוכנת מחשב.
פרופ' שויקה היה חבר בוועדות ציבוריות רבות בתחום עיסוקו, כמו גם בוועדות ציבוריות כמו מליאת רשות השידור (בשנים 1980 – 1984) וחבר הנהלת המרכז למורשת ארם צובא ויו"ר ועדת המחקר שלה (1985 – 1997).
הוא נשוי ואב לשמונה. אחיו של הפיזיקאי יצחק שווה ודודם של הסופר והרב חיים סבתו והרב שבתי סבתו.
קישורים
אוצרות הגניזה יגיעו בקרוב לכל בית בישראל
מי ראוי לקבל את פרס ישראל על מפעל השו"ת
מיתר יש בנפש שהספרות מנגנת עליו