הודעת פתיחה


ברוכים הבאים לבלוג שלי,

מטרתו של בלוג זה היא לשתף אתכם בתובנות שרכשתי במהלך החיים בתחומים שונים. תובנות בנושא החיים שיפורם ושיפורו של העולם.
רוב המאמרים כתובים במבנה של תהליך לוגי. כלומר תהליך בו כל שלב מוביל לשלב הבא, ובצורה זו הוא מוביל את הקורא להבין את אותה התובנה שגיליתי.
אציין מראש שרכישת התובנות המוכלות במאמרים דורשת קריאה סבלנית וחשיבה רבה.
חלק מהמאמרים יופיעו בספר שאני מתכוון לכתוב בעתיד, לכן אשמח לקבל מכם שאלות והערות בונות שיסייעו לי לשפר את המאמרים, להפוך אותם לקריאים ומובנים יותר וכמובן, אם לדעתכם טעיתי במשהו, אשמח לשמוע.

אני מאחל לכם קריאה מהנה, מעניינת ומרחיבת אופקים...

יום חמישי, 16 בספטמבר 2021

מהו מידע?

 


כשאנחנו אומרים שבספר יש מידע, למה אנו מתכוונים?

מה הופך את הספר הזה לבעל מידע, לעומת ספר עם דפים ריקים?
האם למידע בספר יש קיום? כלומר האם הוא ישות פיזית שניתן למדוד?

כדי לענות על השאלות הללו, ראשית בואו נסתכל על מספר סוגים של מידע והעברת מידע:
בספר יש מידע כתוב, הדיבור מעביר מידע באמצעות תנודות קול באוויר, תמונה או ציור מעבירים מידע, מילה מכילה מידע, מספר מכיל מידע, אות או ספרה מכילים מידע, מדיה מכילה מידע, בין אם זאת מדיה אנלוגית, כמו תקליטי ויניל וקלטות, או מדיה דיגיטלית כמו דיסקים וכוננים קשיחים.

ניתן לראות בדוגמאות מעלה, שכאשר אנו מדברים על אכסון או העברת מידע אנו מדברים על ייצוג. כלומר דבר אחד המייצג דבר אחר.
לראשון נקרא מייצג ולשני מיוצג.
המייצג יכול להיות סמל, קוד (code) או מבנה.
המיוצג הוא המשמעות (המיוצג גם יכול להיקרא תוצר, אבל על כך ארחיב בהמשך)

לדוגמה המילה "תפוח" אינה זהה לתפוח עצמו (לפרי). היא קוד המייצג אותו.
קוד זה מורכב ממספר סמלים. האות "ת" היא סמל המייצג צליל מסוים.
ניתן לומר שגם המילה תפוח בעצמה היא סמל. ילד שאינו יודע לקרוא ואינו מכיר את האותיות יכול לראות את המילה "תפוח", להכיר את צורתה, ולדעת מה המשמעות שלה.
אני משתמש במילה קוד כדי לתאר סמל שניתן לפירוק לסמלים נוספים. למשל מילה ניתן לפרק לאותיות, וכל אחת מהן תהיה בעלת משמעות. אך אותיות לא ניתן לפרק לרכיבים בעלי משמעות. לכן את המילה אגדיר כ"קוד" ואת האותיות כ"סמלים".


המילה תפוח אינה זהה לתפוח. היא קוד המיצג אותו


על מנת להמיר את המייצג למיוצג, למשל להמיר קוד למשמעות חייב להתקיים גם מנגנון פירוש (decoding mechanism).
ואכן המילה "תפוח" מפורשת והופכת למשהו אחר.
למה?
למחשבה "תפוח", בתודעתו של מי שרואה או שומע את המילה.
המחשבה "תפוח" היא בעצם המשמעות המתקבלת לאחר פירוש הקוד, כלומר המילה "תפוח".
התודעה שלנו אם כן, מכילה את המשמעות, כלומר את המחשבה תפוח, אך גם את המנגנון המפרש.
היא יודעת לקבל קודים, כגון מילים, ולפרש אותם לכדי מחשבות ומושגים תואמים.
כדי להבין מהו מידע, עלינו לשאול את עצמנו לאילו מהתופעות שהזכרנו קודם, קוד, משמעות או מנגנון פירוש אנו מתכוונים כשאנו מדברים על מידע.
למשל, אם אנו אומרים "השגנו מידע חדש על מדינת האויב", ברור לנו שאנו מתייחסים למשמעות.
אם היינו מקבלים פיסת קוד מוצפן שאף אחד לא יודע לפרש, לא היינו יכולים לומר שהשגנו מידע חדש.
ואכן, במהותו המידע הוא המשמעות. הקוד והמנגנון המפרש הם רכיבים נחוצים לתהליך ייצוג המידע לצורך העברתו למישהו אחר.
כעת, בואו נגיד שילד בן חמש קשקש על דף את הקשקושים האקראיים הבאים:

כעת, בואו נגיד שילד בן 5 קישקש על דף את הקישקושים האקראיים הבאים:

  • 사과
  • ┐_-O
נשאל עצמנו האם הקשקושים הללו מכילים מידע?
אנו נענה מן הסתם שהקשקושים אינם מכילים כל מידע. הילד עצמו לא התכוון לעשות משהו מסוים, ולא ניסה להעביר משמעות כלשהי. הוא סתם צייר ביד חופשית.

עם זאת, הקשקוש הראשון תואם למילה "תפוח" בקוריאנית. הקשקוש השני איננו תואם מילה כלשהי בשפה מוכרת, אך אין כל מניעה שהוא יתאם למילה כלשהי בשפה שאיננו מכירים, או בשפה שנמציא.
יתרה מכך, כל קוד או סמל, יכול "להכיל" מספר משמעויות שונות. למשל הסמל X מייצג את הצליל "אקס" באנגלית, אבל בספרדית הוא עשוי לייצג את הצלילים "ס" או "ח" ובמתמטיקה הוא מייצג את פעולת הכפל.

אם כך אנו רואים שהקודים עצמים אינם מכילים שום משמעות. במובן זה הם אינם מכילים שום מידע.
אז היכן נמצא המידע? איפה שוכן המידע שבספר?
המידע עצמו נמצא נמצא כבר ביעד, כלומר בתודעה.
המשפט "קטפתי תפוח מהעץ", כשלעצמו אינו מכיל שום מידע.
כל המידע במשפט קיים בתוך יעד (במקרה זה תודעה), המכיל מנגנון מפרש היודע לזהות את הקוד (השפה העברית), ויודע לשייך את הקוד למידע המתאים (משמעות) הקיים כבר אצלו.
אם יש לנו את אלו, הסדר של הסמלים בקוד יכול לאפשר לנו ליצור מידע חדש מהמידע שנמצא ברשותנו.

כעת אנו יכולים להבין שספר, כשלעצמו אינו מכיל כל מידע, במובן שאינו מכיל כל משמעות. כמו כן, למידע עצמו אין קיום כישות פיזית. לפחות לא במדיה המכילה את הקוד.

למעשה, כאשר אנחנו קוראים ספר, איננו מקבלים ממנו מידע חדש, אלא משתמשים בו כדי לארגן מחדש את המידע שכבר קיים אצלנו. אם אנחנו קוראים בספר ש"תנין יכול להגיע לאורך של שישה מטרים", אנחנו מחברים את המידע שכבר קיים אצלנו על החיה ושמה תנין, עם המידע שכבר קיים אצלנו על המספר שש והשיטה המטרית, לכדי מידע שלא היה בידינו קודם על אורכו המקסימלי האפשרי של התנין.


הספר הכתוב אינו מכיל יותר מידע מהספר הריק. המידע נמצא כבר במנגנון המפרש אצלנו בתודעה.


מידע ללא משמעות

מידע אינו חייב להיות משמעות בתודעה. ניתן לומר שכל מתקן או מכונה שיש לה קלט (input) ופלט (output) היא מנגנון מפרש.
למשל, מכונה המקבלת קוד כלשהו כקלט וכפלט היא מייצרת בגד כלשהו. המידע המועבר בתהליך זה הוא הפעולות היוצרות את הבגד והסדר שלהן.
זו הסיבה שבתחילת המאמר אמרתי שלרכיב המשמעות של המידע ניתן לקרוא גם "תוצר". מידע המועבר למכונה מפורש לכדי תוצר (או פעולות לייצור התוצר).
בוא נחשוב למשל על מכונה המקבלת בתור קלט קוד בינארי. קוד בינארי הוא סדרת ספרות המכילה רק את הספרות 0 ו- 1. למעשה כל קובץ במחשב הוא כזה. הוא מכיל בסך הכל סדרה של אחדות ואפסים.
כיצד אנו יכולים להחליט האם סדרת מספרים זו מכילה טקסט, אודיו, תמונה או סדרת הוראות להדפסת ציור?
אם נשאל מישהו איזה מידע מכיל הקובץ הזה, הוא עשוי למשל להגיד שזה קובץ המכיל מוזיקה, אך הטענה הזו לא תהיה מדויקת.
את אותו הקובץ ניתן לפתוח עם תוכנה לעריכת טקסט, ונקבל טקסט. ניתן לפתוח אותו בתוכנה גרפית ונקבל תמונה וכך הלאה. רוב הסיכויים שהטקסט שנקבל מהקובץ יהיה גיבוב אותיות חסר משמעות עבורנו, או שהתמונה תיראה לנו כמו ערבוב צבעים חסר משמעות. אם לעומת זאת נפתח אותו בתוכנת שמע, נקבל תוצאה שיש לה משמעות עבורנו וגם תואמת את המשמעות המקורית שרצה להעביר מחבר הקובץ. אך זה לא הקובץ שהכיל את המידע, אלא זוהי התוכנה שידעה לפרש את הקוד באופן שעבורנו הוא משמעותי.
אגב אין שום בעיה לכתוב תוכנה שמשתמשת באותו הקובץ ליצירת תמונה, וידאו או לתת סדרת הוראות למדפסת, שתיתן לנו תוצר בעל משמעות. למשל ניתן ליצור ממנו תמונה המציגה גרף של תדרים, ויזואליזצית וידאו של גלי קול, או אפילו משהו שלא קשור כלל לכוונת המחבר המקורית, כמו למשל יצירת סיסמה ייחודית.

מהות המידע התודעתי

אמרתי קודם שכשאנחנו קוראים ספר איננו קולטים מידע חדש אלא מארגנים מחדש את המידע שכבר ברשותנו. אז אם הספר (או כל קוד אחר), בסך הכל עוזר לנו לארגן את המידע שכבר קיים אצלנו, כיצד אנו משיגים את המידע המקורי שכבר קיים אצלנו?

המידע שקיים אצלנו בתודעה מורכב משלושה סוגים של דחפים:
  1. מידע חושי (או תחושות) - כמו קולות, צבעים, ריח, טעם, טמפרטורה מגע וכו'.
  2. רגשות - כעס, פחד, אהבה וכו'.
  3. מחשבות.
המחשבות הם תהליכי השוואה וחיבור של תחושות ורגשות הקיימים אצלנו בזיכרון. למשל, המושג תפוח הוא מחשבה המאחדת את כל ההתנסויות החושיות שלנו עם פרי התפוח, למשל הטעם, הריח, הצורה, הצבע וכו'. המושג תפוח מאחד תחתו גם מחשבות נוספות הקשורות לתפוח, כגון, "התפוח גדל על עץ", שבתורן מורכבות משילובים של התנסויות חושיות אחרות, כגון לראות עץ עליו גדל פרי.

אי לכך, בסופו של דבר כל המידע בתודעה מורכב מהתנסויות חושיות ורגשיות, והמחשבות הן שילובים של התנסויות אלו. ההתנסויות החושיות נוצרות בחושים עקב השפעות המגיעות מבחוץ, וההתנסויות הרגשיות הן תגובה פנימית המתעוררת עקב ההתנסויות החושיות.
למשל דקירה באצבע מעוררת התנסות חושית של כאב, ובתורה עשויה לעורר התנסות רגשית, למשל כעס.

מידע ישיר ונרמז

אמרתי שספר אינו מכיל מידע במובן שהקוד שבו אינו מכיל את המשמעות המיוחסת לו על ידי הכותב.
אם זה נכון, אז מה ההבדל בין ספר מלא לבין ספר ריק?
מדוע הספר המלא מאפשר לנו להפיק מידע חדש והספר הריק לא?

כדי לענות על כך עלינו לעשות אבחנה נוספת ולראות שכשאנו קוראים את המילים בספר אנחנו קולטים שני סוגים של מידע: מידע ישיר ומידע נרמז.
למשל, כשאנו רואים בספר את המילה "תפוח" אנו מקבלים דרך החושים מידע ישיר אודות הצורה של המילה, הצבע של האותיות, הסדר שלהן, הגודל שלהן וכו'.
כמו כן אנו מקבלים מידע נרמז. המידע הנרמז הוא "הפרי תפוח", אותו ניתן לפרש מהמילה תפוח.

בואו נראה דוגמה נוספת שתעזור לנו להבין מהו מידע ישיר ומהו מידע נרמז:
שני אנשים הולכים ביער ורואים ענף שבור. עבור שניהם המידע הישיר הוא המראה של הענף השבור. אבל אחד מהם הוא גשש, ועבורו הענף השבור מכיל מידע נרמז. הוא מאפשר לו להסיק שעבר כאן דב לפני פחות מיום.

כפי שראינו קודם, המידע הנרמז איננו קיים בספר. הוא איננו תכונה פיזית של הספר. אין שום קשר בין המילה תפוח לבין הפרי תפוח, למעט בתודעתו של מי שכתב את הספר או מי שקורא את הספר (בהנחה שהוא יודע עברית).

לעומת זאת, המידע הישיר, כלומר הסמלים (האותיות) והסדר שלהם, הוא תכונה של הספר.


מבחינה פיזית הספר אינו מכיל מידע נרמז. הוא מכיל מידע ישיר, שאין לו שום קשר מחייב למשמעות שניתן לפרש ממנו.

הספר הכתוב אינו מכיל מידע נרמז. המידע הנרמז נמצא במנגנון המפרש. אבל הוא כן מכיל מידע ישיר והוא המבנה שלו.
רכיב המידע שקראתי לו "סמל" או "קוד" משמש להעברת מידע נרמז.
בעצם רוב מה שאנו קוראים לו מידע ביומיום, ורוב הדוגמאות למידע שנתתי בתחילת המאמר (מילים, אותיות, מספרים…) מתייחסים להעברה של מידע נרמז.
מבין כל הדוגמאות שנתתי, הדוגמה היחידה שמעבירה מידע ישיר היא דוגמה של תמונה.
המידע שמכילה תמונה הוא בדיוק מה שאנו רואים כשאנו מסתכלים עליה.
היא לא מכילה קידוד של מידע כלשהו (אלא אם יוצר התמונה בחר לקודד בתוכה מידע באופן כלשהו). כמו כן היא אינה זקוקה למנגנון פירוש.
למעשה מנגנון פירוש קיים רק במידע נרמז. המידע הישיר איננו ייצוג של מידע אחר. הוא המידע ה"סופי". המידע הישיר זהו המידע הגולמי המגיע מהחושים שלנו.

העברת מידע נרמז ללא קידוד

כעת בואו נלך צעד אחד יותר לעומק ונראה כיצד ניתן להעביר מידע נרמז ללא קוד.
קודם ראינו דוגמה לכך. ענף שבור יכול "להכיל" מידע נרמז עבור גשש. אבל זוהי דוגמה מאוד מופשטת של העברת מידע כי למעשה כל התנסות מכילה עבורנו כמות מאוד גדולה של מידע נרמז, התלוי בניסיון שצברנו בחיים. למשל, כשאנחנו רואים תפוח אנחנו יכולים להסיק מה יהיה הטעם שלו עוד לפני שטעמנו אותו. המידע הישיר (המראה של התפוח), מקושר אצלנו למידע נוסף שצברנו בחיים (הטעם של תפוחים).


דוגמה פחות מופשטת להעברת מידע בלתי מקודד הוא מידע אנלוגי.


מידע אנלוגי נבדל ממידע דיגיטלי בכך שהוא אינו משתמש בסמלים. המילה דיגיטלי (ספרתי) היא שם קצת מגביל כי הוא מתאר רק מידע המיוצג באמצעות ספרות. למעשה המידע הדיגיטלי הוא מקרה פרטי של מידע סימלי (סימבולי). מידע המיוצג על ידי סמלים. סמלים אלו יכולים להיות ספרות, אותיות, צורות או כל סמל שהוא.
קוד מורס לדוגמא הוא קוד המשתמש בשלושה סמלים (נקודה, קו ורווח) כדי לייצג אותיות, מילים ומשפטים.

הרכיב המייצג במידע אנלוגי אינו מכיל סמלים, אלה מבנה.
המבנה אינו זהה למשמעות (או התוצר) המופקים ממנו (ועל כן יש צורך במנגנון פירוש) אך היא תואמת אותו. יש בינהם מתאם.
למשל, לצורת החריצים על פני תקליט הויניל יש מתאם מלא לתנודות האוויר שמפיק הגרמופון, ולבסוף לצלילים שאנחנו שומעים.
פילם (תשליל) של מצלמה אנלוגית מכיל תמונה מוקטנת התואמת את התמונה הסופית המופקת ממנה.
למעשה הרבה סוגים של מידע דיגיטלי מומרים למידע אנלוגי לפני שהם הופכים לתוצר הסופי.
למשל קובץ אודיו מפורש לכדי תנודות חשמליות המועברות לרמקול. התנודות החשמליות הללו אינן מקודדות יותר. הן.

ההבדל בין ייצוג סמלי לאנלוגי

נכון להיום נהוג לחלק את הדרכים לייצוג מידע לדיגיטלי ואנלוגי.
לטעמי החלוקה הזו אינה מספיק מדויקת בשביל להבין את התכונות השונות של סוגי הייצוגים, ולכן אציג צורת חלוקה קצת שונה.

לדעתי השם המתאים יותר לחלוקה הנהוגה כיום הינה מידע בדיד ומידע רציף,
היות והתכונה העיקרית המשויכת לייצוג דיגיטלי היא היותו בדיד, בעוד הייצוג האנלוגי הוא רציף.
לדוגמה, בתקליט ויניל, שהוא ייצוג אנלוגי, חורצים חריצים המייצגים את הצליל. עומק (או רוחב) החריטה מייצגים את עוצמת הצליל. כך שאם למשל ההקלטה שלנו כוללת צלילים בטווח עוצמות בין 0 ל-100 דציבל ועומק החריץ יכול לנוע מ-0 עד 1 מ"מ, אז ניתן לייצג כל עוצמת קול אפשרית באמצעות עומק החריץ המתאים. למשל עוצמה של 53.223 דציבל, יכולה להיות מיוצגת, לצורך העניין, על ידי חריץ בעומק 0.53223 מ"מ.
טווח הערכים האפשריים לעוצמה הוא רציף.
לעומת זאת אם הצליל שמור באופן דיגיטלי, הוא יכול לקבל רק ערכים מסוימים. למשל 1 דציבל, 1.05 דציבל, 1.10 דציבל וכך הלאה. אלו הם ערכים בדידים.


  

                


תצורת גל אנלוגית (ימין), בעלת ערכים רציפים. תצוגת גל דיגיטלית (שמאל) בעלת ערכים בדידים.


באופן תיאורטי גם הערכים שיכול לתת המבנה האנלוגי הם בדידים. למשל, ניתן לשער שהשינויים האפשריים הקטנים ביותר בעומק החריץ של תקליט הויניל הם גובהה של מולקולת pvc יחידה. במקרה זה ערך השינוי הקטן ביותר עשוי להיות, נניח, מיליארדית הדציבל.
בפועל לא ניתן לשמור מידע באמינות גבוהה באמצעות שינויים כה קטנים בחומר.
ראשית מולקולות ה-pvc הן שרשראות לא אחידות בגודלן וגם אינן מסודרות באופן אחיד במרחב - כך שהערכים הבדידים שהן יכולות לייצג אינם אחידים.
שנית, אם המידע היה נרשם על ידי הבדלים כה עדינים במבנה התקליט, היו מספיקות הפרעות מאוד עדינות, כמו למשל גרגר אבק שנצמד לתקליט, כדי לגרום לעיוות של המידע.

כפי שהזכרתי קודם, ייצוג דיגיטלי הוא מקרה פרטי של ייצוג סמלי. 

כך למשל בקוד בינארי יש שני סמלים בלבד, 0 ו-1, ובמספרים עשרוניים ישנם עשרה סמלים, מ-0 עד 9.

למעשה כל ייצוג סמלי נותן לנו מידע בדיד כיוון שלכל סמל משוייכת משמעות מדויקת. אין דרגות של משמעויות.
המילה אהבה תמיד תייצג את אותה המשמעות, ואין זה משנה אם נכתוב אותה באותיות גדולות יותר או קטנות יותר.

המשמעות האטימולוגית של המילה אנלוגי היא בעלת מתאם או פרופורציה.
כשאנו מסתכלים על מדיה אנלוגית אנו רואים שקיים מתאם מסוים בין המבנה המייצג, נניח החריצים בתקליט הויניל, לבין המידע המיוצג, למשל הצלילים שאנו שומעים.

סמל לעומת זאת, הוא מייצג שאין בינו לבין המיוצג כל מתאם. המילה "אהבה" אינה תואמת את הרגש שאנו משייכים אליה. לא ניתן ללמוד מהמבנה של המילה דבר על המשמעות המוכלת בתוכה.

אי לכך אני מעדיף לכנות את סוגי ייצוגי המידע השונים סמלי ואנלוגי.

כפי שציינתי קודם הייצוג הסמלי הוא תמיד בדיד, עם זאת מבנים אנלוגיים (במובן שהגדרתי כאן - של קיום מתאם בין המייצג למיוצג) יכולים להיות גם רציפים וגם בדידים. חשבוניה למשל הוא מכשיר שנותן לנו ערכים בדידים. כמויות מדויקות של חרוזים. עם זאת כמויות החרוזים הן בעלות מתאם מושלם למשמעות המספרית המיוצגת על ידם.

למען האמת החשבוניה היא צורת ייצוג משולבת שהיא גם סמלית וגם אנלוגית כיוון שכל חרוז הוא לכשעצמו סמל המייצג את המשמשמעות של יחידה אחת.

תיאוריית המידע

תיאוריית המידע הינה תיאוריה מתמטית שפותחה בשנות הארבעים של המאה ה-20.
זוהי תיאוריה החוקרת את הדרכים להעביר מידע ואת הגבולות של העברת מידע. למשל היא עוסקת בשאלה עד כמה ניתן לכווץ מידע מבלי לאבד אותו. לתיאוריה זו שימושים רבים הבאים לידי ביטוי במיוחד בעולם המחשוב.
למרות התובנות הרבות שהושגו הודות לתיאוריה זו, היא מוגבלת ביכולת שלנו להבין באופן מלא את התופעה לה אנו קוראים מידע, היות והיא כלל לא עוסקת בחלק המידע הכולל את המשמעות, אלא רק בחלק המידע העוסק במה שקראתי לו קוד.
כמו כן היא כמעט וכלל אינה עוסקת או מתייחסת למנגנון המפרש. אם הייתה מתמקדת גם במנגנון המפרש, היא הייתה עשויה להגיע לתובנות נוספות ואולי אפילו שונות, כמו למשל שכל כיווץ מידע המתבצע על ידי כיווץ של הקוד, דורש הגדלה של המידע שמכיל המנגנון המפרש (על כך ארחיב במאמר נפרד).

המושג מידע בפיסיקה

הערה קטנה שהיה חשוב לי לציין. בפיסיקה גם משתמשים במונח "מידע" אך במשמעות אחרת.
עבור הפיסיקאי, מידע זה כל תכונה שיש ביקום או במערכת ושניתן למדוד או לחשב אותה.
מיקומו של גוף, מהירותו, המאסה, הכח, התנע, הספין, כל אלו נקראים על ידי הפיסיקאי מידע.
כמובן שמידע זה שונה מהמידע שתיארנו קודם. מידע זה איננו קידוד אלא התופעה עצמה.
לעיתים מבלבלים בין השניים ומחברים בין השניים באופן שגוי, למשל בהבנה של מושג האנטרופיה.
גם על כך ארחיב במאמר נפרד.

אין תגובות:

הוסף רשומת תגובה

אשמח לענות לשאלות ענייניות לגבי הדברים שכתבתי, וכן מאוד אשמח לקבל נקודות מבט בונות והערות עליהם, על מנת שאוכל להרחיב את נקודות המבט שלי.