הודעת פתיחה


ברוכים הבאים לבלוג שלי,

מטרתו של בלוג זה היא לשתף אתכם בתובנות שרכשתי במהלך החיים בתחומים שונים. תובנות בנושא החיים שיפורם ושיפורו של העולם.
רוב המאמרים כתובים במבנה של תהליך לוגי. כלומר תהליך בו כל שלב מוביל לשלב הבא, ובצורה זו הוא מוביל את הקורא להבין את אותה התובנה שגיליתי.
אציין מראש שרכישת התובנות המוכלות במאמרים דורשת קריאה סבלנית וחשיבה רבה.
חלק מהמאמרים יופיעו בספר שאני מתכוון לכתוב בעתיד, לכן אשמח לקבל מכם שאלות והערות בונות שיסייעו לי לשפר את המאמרים, להפוך אותם לקריאים ומובנים יותר וכמובן, אם לדעתכם טעיתי במשהו, אשמח לשמוע.

אני מאחל לכם קריאה מהנה, מעניינת ומרחיבת אופקים...

יום חמישי, 16 בספטמבר 2021

מהו מידע?

 


כשאנחנו אומרים שבספר יש מידע, למה אנו מתכוונים?

מה הופך את הספר הזה לבעל מידע, לעומת ספר עם דפים ריקים?
האם למידע בספר יש קיום? כלומר האם הוא ישות פיסיקלית שניתן למדוד?

כדי לענות על השאלות הללו, ראשית בואו נסתכל על מספר סוגים של מידע והעברת מידע:
בספר יש מידע כתוב, הדיבור מעביר מידע באמצעות תנודות קול באוויר, תמונה או ציור מעבירים מידע, מילה מכילה מידע, מספר מכיל מידע, אות או ספרה מכילים מידע, מדיה מכילה מידע, בין אם זאת מדיה אנלוגית, כמו תקליטי ויניל וקלטות, או מדיה דיגיטלית כמו דיסקים וכוננים קשיחים.

קל לראות שכל דבר שאנחנו מיחסים לו העברת מידע מורכב משני רכיבים: קוד (code) ומשמעות.
לרכיב המשמעות ניתן לקרוא גם תוצר, אבל על כך ארחיב בהמשך)

קוד או סמל זה בעצם דבר אחד המתייחס לדבר אחר.
למשל המילה "תפוח" אינה זהה לתפוח עצמו (לפרי). היא קוד המייצג אותו.
קוד זה מורכב ממספר סמלים. האות "ת" היא סמל המייצג צליל מסוים.
ניתן לומר שגם המילה תפוח בעצמה היא סמל. ילד שאינו יודע לקרוא ואינו מכיר את האותיות יכול לראות את המילה "תפוח" להכיר את צורתה ולדעת מה המשמעות שלה.
אני משתמש במילה קוד כדי ליצג סמל שניתן לפירוק לסמלים נוספים. למשל מילה ניתן לפרק לאותיות, וכל אחת מהן תהיה בעלת משמעות. אך אותיות לא ניתן לפרק לרכיבים בעלי משמעות. לכן את המילה אגדיר כ"קוד" ואת האותיות כ"סמלים".

המילה תפוח אינה זהה לתפוח. היא קוד המיצג אותו


על מנת להמיר קוד למשמעות חייב להתקיים גם מנגנון פירוש (decoding mechanism).
ואכן המילה "תפוח" מפורשת והופכת למשהו אחר.
למה?
למחשבה "תפוח", בתודעתו של מי שרואה או שומע את המילה.
המחשבה "תפוח" היא בעצם המשמעות המתקבלת לאחר פירוש הקוד, כלומר המילה "תפוח".
התודעה שלנו אם כן, מכילה את המשמעות, כלומר את המחשבה תפוח, אך גם את המנגנון המפרש.
היא יודעת לקבל קודים, כגון מילים, ולפרש אותם לכדי מחשבות ומושגים תואמים.

כדי להבין מהו מידע, עלינו לשאול את עצמנו לאילו מהתופעות שהזכרנו קודם, קוד, משמעות או מנגנון פירוש אנו מתכוונים כשאנו מדברים על מידע.
למשל, אם אנו אומרים "השגנו מידע חדש על מדינת האויב", ברור לנו שאנו מתייחסים למשמעות.
אם היינו מקבלים פיסת קוד מוצפן שאף אחד לא יודע לפרש, לא נוכל לומר שהשגנו מידע חדש.
ואכן, במהותו המידע הוא המשמעות. הקוד והמנגנון המפרש הם רכיבים הקשורים בתהליך של ייצוג מידע והעברת מידע.

כעת, בואו נגיד שילד בן 5 קישקש על דף את הקישקושים האקראיים הבאים:

  • 사과
  • ┐_-O
נשאל עצמנו האם הקישקושים הללו מכילים מידע?
אנו נענה מן הסתם שהקשקושים אינם מכילים כל מידע. הילד עצמו לא התכוון לעשות משהו ספציפי, ולא ניסה להעביר משמעות כלשהי. הוא סתם צייר ביד חופשית.

עם זאת, הקישוש הראשון תואם למילה "תפוח" בקוריאנית. הקשקוש השני איננו תואם מילה כלשהי בשפה מוכרת, אך אין כל מניעה שהוא יתאם למילה כלשהי בשפה שאיננו מכירים, או בשפה שנמציא.
יתרה מכך, כל קוד או סמל, יכול "להכיל" מספר משמעותיות שונות. למשל הסמל X מייצג את הצליל "אקס" באנגלית, אבל בספרדית הוא עשוי לייצג את הצלילים "ס" או "ח" ובמתמטיקה הוא מייצג את פעולת הכפל.

אם כך אנו רואים שהקודים עצמים אינם מכילים שום שמעות. במובן זה הם אינם מכילים שום מידע.
אז היכן נמצא המידע? איפה שוכן המידע שבספר?
המידע עצמו נמצא נמצא כבר ביעד, כלומר בתודעה.
המשפט "קטפתי תפוח מהעץ", לכשעצמו אינו מכיל שום מידע.
כל המידע במשפט קיים בתוך יעד (במקרה זה תודעה), המכיל מנגנון מפרש היודע לזהות את הקוד (השפה העברית), ויודע לשייך את הקוד למידע (משמעות) המתאים הקיים כבר אצלו.
אם יש לנו את אלו, הסדר של הסמלים בקוד יכול לאפשר לנו ליצור מידע חדש מהמידע שנמצא ברשותנו.

כעת אנו יכולים להבין שספר, לכשעצמו אינו מכיל כל מידע, במובן שאינו מכיל כל משמעות. כמו כן, למידע עצמו אין קיום כישות פיסיקלית. לפחות לא במדיה המכילה את הקוד.

למעשה, כאשר אנחנו קוראים ספר, איננו מקבלים ממנו מידע חדש, אלא משתמשים בו כדי לארגן מחדש את המידע שכבר קיים אצלנו. אם אנחנו קוראים בספר ש"תנין יכול להגיע לאורך של שישה מטרים", אנחנו מחברים את המידע שכבר קיים אצלנו אודות החיה ושמה תנין, עם המידע שכבר קיים אצלנו אודות המספר שש והשיטה המטרית, לכדי מידע שלא היה בידינו קודם על אורכו המקסימלי האפשרי של התנין.


הספר הכתוב אינו מכיל יותר מידע מהספר הריק. המידע נמצא כבר במנגנון המפרש אצלנו בתודעה.


מידע ללא משמעות

מידע אינו חייב להיות משמעות בתודעה. ניתן לומר שכל מתקן או מכונה שיש לה קלט (input) ופלט (output) היא מנגנון מפרש. למשל, מכונה המקבלת קוד כלשהו כקלט וכפלט היא מייצרת בגד כלשהו.
המידע המועבר בתהליך זה הוא הפעולות היוצרות את הבגד והסדר שלהן.

זו הסיבה שבתחילת המאמר אמרתי שלרכיב המשמעות של המידע ניתן לקרוא גם "תוצר". מידע המועבר למכונה מפורש לכדי תוצר (או פעולות לייצור התוצר).

בוא נחשוב למשל על מכונה שמקבלת בתור קלט קוד בינארי. קוד בינארי הוא סדרת ספרות המכילה רק את הספרות 0 ו- 1. למעשה כל קובץ במחשב הוא כזה. הוא מכיל בסך הכל סדרה של אחדות ואפסים.
כיצד אנו יכולים להחליט האם סדרת מספרים זו מכילה טקסט, אודיו, תמונה או סדרת הוראות להדפסת ציור?
אם נשאל מישהו איזה מידע מכיל הקובץ הזה, הוא עשוי למשל להגיד שזה קובץ המכיל מוסיקה, אך הטענה הזו לא תהיה מדויקת.
את אותו הקובץ ניתן לפתוח עם תוכנה לעריכת טקסט, ונקבל טקסט. ניתן לפתוח אותו בתוכנה גרפית ונקבל תמונה וכך הלאה. רוב הסיכויים שהטקסט שנקבל מהקובץ יהיה גיבוב אותיות חסר משמעות עבורנו, או שהתמונה תראה לנו כמו ערבוב צבעים חסר משמעות. אם לעומת זאת נפתח אותו בתוכנת שמע, נקבל תוצאה שיש לה משמעות עבורנו וגם תואמת את המשמעות המקורית שרצה להעביר מחבר הקובץ. אך זה לא הקובץ שהכיל את המידע, אלא זוהי התוכנה שידעה לפרש את הקוד באופן שעבורנו הוא משמעותי.
אגב אין שום בעיה לכתוב תוכנה שמשתמשת באותו הקובץ ליצירת תמונה, וידאו או לתת סדרת הוראות למדפסת, שתיתן לנו תוצר בעלת משמעות. למשל תמונה המציגה גרף של תדרים, ויזואליזצית וידאו של גלי קול, או אפילו משהו שלא קשור כלל לכוונת המחבר המקורית, כמו למשל יצירת סיסמה ייחודית.

מהות המידע התודעתי

אמרתי קודם שכשאנחנו קוראים ספר איננו קולטים מידע חדש אלא מארגנים מחדש את המידע שכבר ברשותנו. אז אם הספר (או כל קוד אחר), בסך הכל עוזר לנו לארגן את המידע שכבר קיים אצלנו, כיצד אנו משיגים את המידע המקורי שכבר קיים אצלנו?

המידע שקיים אצלנו בתודעה מורכב משלושה סוגים של דחפים:
  1. מידע חושי (או תחושות) - כמו קולות, צבעים, ריח, טעם, טמפרטורה מגע וכו'.
  2. רגשות - כעס, פחד, אהבה וכו'.
  3. מחשבות.
המחשבות הם תהליכי השוואה וחיבור של תחושות ורגשות הקיימים אצלנו בזכרון. למשל, המושג תפוח הוא מחשבה המאחדת את כל ההתנסויות החושיות שלנו עם פרי התפוח, למשל הטעם, הריח, הצורה, הצבע וכו'. המושג תפוח מאחד תחתו גם מחשבות נוספות הקשורות לתפוח, כגון, "התפוח גדל על עץ", שבתורן מורכבות משילובים של התנסויות חושיות אחרות, כגון לראות עץ עליו גדל פרי.

אי לכך, בסופו של דבר כל המידע בתודעה מורכב מהתנסויות חושיות ורגשיות, והמחשבות הן שילובים של התנסויות אלו. ההתנסויות החושיות נוצרות בחושים עקב השפעות המגיעות מבחוץ, וההתנסויות הרגשיות הן תגובה פנימית המתעוררת עקב ההתנסויות החושיות.
למשל דקירה באצבע מעוררת התנסות חושית של כאב, ובתורה עשויה לעורר התנסות רגשית, למשל כעס.

מידע ישיר ונרמז

אמרתי שספר אינו מכיל מידע במובן שהקוד שבו אינו מכיל את המשמעות המיוחסת לו על ידי הכותב.
אם זה נכון, אז מה ההבדל בין ספר מלא לבין ספר ריק?
מדוע הספר המלא מאפשר לנו להפיק מידע חדש והספר הריק לא?

כדי לענות על כך עלינו לעשות אבחנה נוספת ולראות שכשאנו קוראים את המילים בספר אנחנו קולטים שני סוגים של מידע: מידע ישיר ומידע נרמז.
למשל, כשאנו רואים בספר את המילה "תפוח" אנו מקבלים דרך החושים מידע ישיר אודות הצורה של המילה, הצבע של האותיות, הסדר שלהן, הגודל שלהן וכו'.
כמו כן אנו מקבלים מידע נרמז. המידע הנרמז הוא "הפרי תפוח", אותו ניתן לפרש מהמילה תפוח.

בואו נראה דוגמא נוספת שתעזור לנו להבין מהו מידע ישיר ומהו מידע נרמז:
שני אנשים הולכים ביער ורואים ענף שבור. עבור שניהם המידע הישיר הוא המראה של הענף השבור. אבל אחד מהם הוא גשש, ועבורו הענף השבור מכיל מידע נרמז. הוא מאפשר לו להסיק שעבר כאן דב לפני פחות מיום.

כפי שראינו קודם, המידע הנרמז איננו קיים בספר. הוא איננו תכונה פיסיקלית של הספר. אין שום קשר בין המילה תפוח לבין הפרי תפוח, למעט בתודעתו של מי שכתב את הספר או מי שקורא את הספר (בהנחה שהוא יודע עברית).

לעומת זאת, המידע הישיר, כלומר הסמלים (האותיות) והסדר שלהם, הוא תכונה של הספר.

מבחינה פיסיקלית הספר אינו מכיל מידע נרמז. הוא מכיל מידע ישיר, שאין לו שום קשר מחייב למשמעות שניתן לפרש ממנו.

הספר הכתוב אינו מכיל מידע נרמז. המידע הנרמז נמצא במנגנון המפרש. אבל הוא כן מכיל מידע ישיר והוא המבנה שלו.

העברת מידע נרמז ללא קידוד

בשלב זה יתכן וכבר הסקתם בעצמכם, שרכיב המידע שקראתי לו "קוד" משמש להעברת מידע נרמז.
בעצם רוב מה שאנו קוראים לו מידע ביומיום, ורוב הדוגמאות למידע שנתתי בתחילת המאמר (מילים, אותיות, מספרים…) מתייחסים להעברה של מידע נרמז.
מבין כל הדוגמאות שנתתי, הדוגמא היחידה שמעבירה מידע ישיר היא דוגמה של תמונה.
המידע שמכילה תמונה הוא בדיוק מה שאנו רואים כשאנו מסתכלים עליה. היא לא מכילה קידוד של מידע כלשהו (אלא אם יוצר התמונה בחר לקודד בתוכה מידע באופן כלשהו).
כעת אנחנו יכולים ללכת צעד אחד יותר לעומק ולראות כיצד ניתן להעביר מידע נרמז ללא קוד.

קודם ראינו דוגמא לכך. ענף שבור יכול "להכיל" מידע נרמז עבור גשש. אבל זוהי דוגמא מאוד מופשטת של העברת מידע כי למעשה כל התנסות מכילה עבורנו כמות מאוד גדולה של מידע נרמז, התלוי בנסיון שצברנו בחיים. למשל, כשאנחנו רואים תפוח אנחנו יכולים להסיק מה יהיה הטעם שלו עוד לפני שטעמנו אותו. המידע הישיר (המראה של התפוח), מקושר אצלנו למידע נוסף שצברנו בחיים (הטעם של תפוחים).

דוגמא פחות מופשטת להעברת מידע בלתי מקודד הוא מידע אנלוגי.

מידע אנלוגי, שונה ממידע דיגיטלי בכך שהוא אינו משתמש בסמלים. המילה דיגיטלי (ספרתי) היא מילה קצת מטעה כיוון שמידע דיגיטלי אינו חייב להיות מיוצג בספרות. מידע דיגיטלי הוא מידע המיוצג על ידי סמלים. סמלים אלו יכולים להיות ספרות, אותיות, צורות או כל סמל שהוא. הנקודה החשובה היא שהוא מקודד. יש לקודד את הסמלים חזרה למשמעות שהם מייצגים.

מידע אנלוגי איננו מקודד. המדיה המכילה את המידע אינה זהה למשמעות (או התוצר) המופקים ממנה, אך היא תואמת אותו.
למשל, צורת החריצים על פני תקליט הויניל תואמת באופן מלא את תנודות האוויר שמפיק הגרמופון, ואת הצלילים שאנחנו שומעים.
פילם (תשליל) של מצלמה אנלוגית מכיל תמונה מוקטנת התואמת את התמונה הסופית המופקת ממנה.
למעשה הרבה סוגים של מידע דיגיטלי מומרים למידע אנלוגי לפני שהם הופכים לתוצר הסופי.
למשל קובץ אודיו מפורש לכדי תנודות חשמליות המועברות לרמקול. התנודות החשמליות הללו אינן מקודדות יותר. הן אנלוגיות לצלי
לים שיפיק הרמקול.

תיאוריית המידע

תיאוריית המידע הינה תיאוריה מתמטית שפותחה בשנות הארבעים של המאה ה-20.
זוהי תיאוריה החוקרת את הדרכים להעביר מידע ואת הגבולות של העברת מידע. למשל היא עוסקת בשאלה עד כמה ניתן לכווץ מידע מבלי לאבד אותו. לתיאוריה זו שימושים רבים הבאים לידי ביטוי במיוחד בעולם המחשוב.
למרות התובנות הרבות שהושגו הודות לתיאוריה זו, היא מוגבלת ביכולת שלנו להבין באופן מלא את התופעה לה אנו קוראים מידע, היות והיא כלל לא עוסקת בחלק המידע הכולל את המשמעות, אלא רק בחלק המידע העוסק במה שקראתי לו קוד.
כמו כן היא כמעט וכלל אינה עוסקת או מתייחסת למנגנון המפרש. אם הייתה מתמקדת גם במנגנון המפרש, היא הייתה עשויה להגיע לתובנות נוספות ואולי אפילו שונות, כמו למשל שכל כיווץ מידע המתבצע על ידי כיווץ של הקוד, דורש הגדלה של המידע שמכיל המנגנון המפרש (על כך ארחיב במאמר נפרד).

המושג מידע בפיסיקה

הערה קטנה שהיה חשוב לי לציין. בפיסיקה גם משתמשים במונח "מידע" אך במשמעות אחרת.
עבור הפיסיקאי, מידע זה כל תכונה שיש ביקום או במערכת ושניתן למדוד או לחשב אותה.
מיקומו של גוף, מהירותו, המאסה, הכח, התנע, הספין, כל אלו נקראים על ידי הפיסיקאי מידע.
כמובן שמידע זה שונה מהמידע שתיארנו קודם. מידע זה איננו קידוד אלא התופעה עצמה.
לעיתים מבלבלים בין השניים ומחברים בין השניים באופן שגוי, למשל בהבנה של מושג האנטרופיה.
גם על כך ארחיב במאמר נפרד.