כיום, יש 7150 שפות בעולם השייכות ל-142 משפחות שפות. הם נוצרו והתפתחו בתקופות היסטוריות שונות, ושרדו עד היום בצורתם המשתמרת והמוגמרת. אבל מגוון לשוני כה גדול אינו אינדיקטור, מכיוון שכמעט 70% מאוכלוסיית העולם משתמשת רק ב-40 שפות, והרוב המכריע של 7110 הנותרים נמצאים בסכנת הכחדה.
היסטוריה של כתיבה
תחילת התפתחות הדיבור והכתיבה - בהבנתנו הנוכחית - יכולה להיקרא הופעת הסמלים וההירוגליפים הפיקטוגרפיים הראשונים: בתקופה שבין המאה ה-5 עד המאה ה-6 לפנה"ס. במהלך מחקר ארכיאולוגי הם נמצאו במסופוטמיה, באזור הסורי-פלסטיני, בשטח אבחזיה המודרנית ובנהר הצהוב בסין. כתבים אלו שייכים למה שנקרא "כתיבה פרוטו", והתפתחו עד לכתב הנוכחי רק במאות ה-3-2 לפני הספירה.
לכן, כתב "אמיתי" בצורת סמלים מובנים הופיע במצרים העתיקה בשנת 3100 לפנה"ס, בצפון-מערב הינדוסטאן בשנת 3000 לפנה"ס, ובשומרית העתיקה בשנת 2750 לפנה"ס. הכתבים שנמצאו בפרו (2500 לפנה"ס), כרתים (2000 לפנה"ס) וסין (1400 לפנה"ס) מתוארכים לשנים מאוחרות יותר. משנת 1000 עד 100 לפני הספירה נוצרו האלפביתים של אסיה הקטנה, האלפבית האטרוסקי, הכתב המרובע העברי והכתב הנבט. לגבי האלפבית הלטיני - הנפוץ ביותר כיום, הוא הגיע מהאטרוסקי: בסביבות 400 לפני הספירה.
אירוע ציון דרך לכתיבה עולמית היה המצאת הנייר בסין, בערך באותו זמן ללידתו של ישו (0 לספירה). הוא הפך לנושא אוניברסלי, והכי חשוב, לנושא נייד של מידע: בניגוד לטבליות אבן מגושמות וקונכיות צב, הוא הפך לנפוץ, תחילה בקרב האליטות, ולאחר מכן בקרב מעמד הביניים.
במקביל לכתיבה האסיאתית התפתחה הכתיבה האירופית על סמך האלפבית הלטיני שאומץ באימפריה הרומית. אבל הוא הגיע לצורתו המודרנית רק בשנת 1300, כאשר הקטנה הקרולינגית קמה לתחייה והכתיבה המכונה "הומניסטית" אושרה. בשנת 1700, האלפבית הקירילי אומץ ברוסיה ("הכתב האזרחי" של פיטר הראשון), ובמאה ה-19 החלה ההתאמה העולמית של האלפבית הלטיני לשפות אחרות. עד כה, הוא הנפוץ ביותר, ונמצא בשימוש ב-131 מתוך 195 מדינות.
עובדות מעניינות
- מתוך 7150 השפות הקיימות, ניתן לשמוע את הרוב המכריע (90%) רק באפריקה ובאסיה. הם נאמרים על ידי בסך הכל 90-100 אלף איש. ניבים אלו נחשבים בסכנת הכחדה, והם מצטמצמים מדי עשור.
- אחד הפוליגלוטים הבולטים הידועים בהיסטוריה העולמית היה ג'וזפה גספרו מצופנטי, קרדינל איטלקי שדיבר 60 שפות.
- התו הנפוץ ביותר בעולם הוא האות הלטינית "e". במיוחד על מנת לצמצם את משמעותו ולהפריך את חשיבותו, ארנסט וינסנט רייט כתב את הרומן גדסבי בשנת 1939, המורכב מ-50 אלף מילים שאינן מכילות מכתב זה.
- מלאי התווים הגדול ביותר הוא בסינית: יותר מ-80,000. אבל כמעט כולן אינן בשימוש בחיי היומיום, וכדי להבין 99% מהכתוב בעיתונות ובאינטרנט, מספיק לדעת רק 2000 תווים. ול-80% מההבנה, מספיקים 500 הירוגליפים.
- אם גודל הגופן הוא 12 נק', דף A4 סטנדרטי יתאים בממוצע ל-2400 תווים ללא רווחים. לפיכך, 1000 תווים תופסים בערך 2/5 מהעמוד, 2000 תווים ─ 4/5 מפורמט A4.
- סטלה פג'ונאס-גרננד הייתה ההקלדה המהירה ביותר בעולם. ב-1946 היא הגיעה ל-1080 תווים בדקה במכונת כתיבה חשמלית של IBM. הזוכה המודרנית, האנגלייה ברברה בלקבורן, לא הצליחה לשבור את השיא הזה על מקלדת מחשב. בשנת 2005, היא הקלידה 1060 תווים בדקה.
- מהירות ההקלדה הממוצעת היא כ-200 תווים לדקה. מסתבר שגברים מקלידים מהר יותר מנשים, למרות שהם צריכים להקליד בתדירות נמוכה יותר.
- יש 150,000 מילים במילון האקדמי הגדול.
במאה ה-21 האינפורמטיבית, כל הנתונים הטקסטואליים מתורגמים לצורה דיגיטלית ולשפות שונות. במקרה של יצירות אמנות וכרוניקות היסטוריות, התרגום והעריכה מופקדים בידי מומחים, ולטקסטים חסרי חשיבות, ישנם אלגוריתמים אוטומטיים המובנים במתרגמים מקוונים וב"מונהי תווים". האחרונים "יכולים" לספור לא רק את מספר התווים (עם ובלי רווחים), אלא גם את מספר הפסקאות, המילים (חד-הברות ורב-הברות), הברות, משפטים, פסקאות וכו'. זה מאוד מפשט את העבודה עם טקסט/שפה מידע, ומאפשר לך להביא אותו לצורה המתאימה באופן אוטומטי וללא שימוש במילון.