Ngày nay trên thế giới có 7150 ngôn ngữ thuộc 142 họ ngôn ngữ. Chúng bắt nguồn và phát triển trong các thời đại lịch sử khác nhau, và tồn tại cho đến ngày nay ở dạng đã biến đổi và hoàn thiện. Nhưng sự đa dạng về ngôn ngữ lớn như vậy không phải là một chỉ số, bởi vì gần 70% dân số thế giới chỉ sử dụng 40 ngôn ngữ và phần lớn trong số 7110 ngôn ngữ còn lại đang bị đe dọa.
Lịch sử thành văn
Sự khởi đầu của sự phát triển của tiếng nói và chữ viết - theo cách hiểu hiện tại của chúng ta - có thể được gọi là sự xuất hiện của các ký hiệu tượng hình và chữ tượng hình đầu tiên: trong khoảng thời gian từ thế kỷ thứ 5 đến thế kỷ thứ 6 trước Công nguyên. Trong quá trình nghiên cứu khảo cổ học, chúng được tìm thấy ở Mesopotamia, vùng Syro-Palestine, trên lãnh thổ của Abkhazia hiện đại và trên sông Hoàng Hà ở Trung Quốc. Những chữ viết này thuộc về cái gọi là "chữ viết sơ khai" và chỉ phát triển thành chữ viết hiện nay từ thế kỷ thứ 3 đến thế kỷ thứ 2 trước Công nguyên.
Như vậy, chữ viết "thực" dưới dạng ký hiệu có cấu trúc đã xuất hiện ở Ai Cập cổ đại vào năm 3100 trước Công nguyên, ở Tây Bắc Hindustan vào năm 3000 trước Công nguyên và ở Sumer cổ đại vào năm 2750 trước Công nguyên. Các tác phẩm được tìm thấy ở Peru (2500 TCN), Crete (2000 TCN) và Trung Quốc (1400 TCN) có từ những năm sau đó. Từ năm 1000 đến 100 trước Công nguyên, bảng chữ cái Tiểu Á, bảng chữ cái Etruscan, chữ viết vuông tiếng Do Thái và chữ viết Nabat đã được tạo ra. Đối với bảng chữ cái Latinh - phổ biến nhất hiện nay, nó có nguồn gốc từ người Etruscan: khoảng năm 400 trước Công nguyên.
Một sự kiện mang tính bước ngoặt đối với chữ viết thế giới là việc phát minh ra giấy ở Trung Quốc, cùng thời điểm với sự ra đời của Chúa Giê-su (0 sau Công nguyên). Nó đã trở thành một vật mang thông tin phổ biến và quan trọng nhất: không giống như những tấm bia đá cồng kềnh và mai rùa, nó đã trở nên phổ biến, đầu tiên là trong giới tinh hoa, sau đó là trong tầng lớp trung lưu.
Song song với chữ viết châu Á, chữ viết châu Âu phát triển dựa trên bảng chữ cái Latinh được sử dụng trong Đế chế La Mã. Nhưng nó chỉ xuất hiện ở dạng hiện đại vào năm 1300, khi chữ viết Carolingian được hồi sinh và cái gọi là chữ viết “nhân văn” được chấp thuận. Vào năm 1700, bảng chữ cái Cyrillic đã được thông qua ở Nga ("chữ viết dân sự" của Peter I), và vào thế kỷ 19, sự chuyển thể toàn cầu của bảng chữ cái Latinh sang các ngôn ngữ khác bắt đầu. Cho đến nay, nó là phổ biến nhất và được sử dụng ở 131 trên 195 quốc gia.
Sự thật thú vị
- Trong số 7150 ngôn ngữ đang tồn tại, đại đa số (90%) chỉ có thể nghe được ở Châu Phi và Châu Á. Chúng được nói bởi tổng cộng 90-100 nghìn người. Những phương ngữ này được coi là có nguy cơ tuyệt chủng và giảm đi sau mỗi thập kỷ.
- Một trong những người đa ngôn ngữ nổi bật nhất được biết đến trong lịch sử thế giới là Giuseppe Gasparo Mezzofanti, một hồng y người Ý nói được 60 thứ tiếng.
- Ký tự phổ biến nhất trên thế giới là chữ cái Latinh "e". Đặc biệt để giảm bớt ý nghĩa và bác bỏ tính tất yếu của nó, Ernest Vincent Wright đã viết cuốn tiểu thuyết Gadsby vào năm 1939, gồm 50 nghìn từ không chứa chữ cái này.
- Ký tự lớn nhất là tiếng Trung: hơn 80.000. Nhưng hầu như tất cả chúng không được sử dụng trong cuộc sống hàng ngày và để hiểu 99% những gì được viết trên báo chí và Internet, chỉ cần biết là đủ 2000 ký tự. Và để hiểu được 80% thì 500 chữ tượng hình là đủ.
- Nếu kích thước phông chữ là 12 pt, một trang A4 tiêu chuẩn sẽ chứa trung bình 2400 ký tự không có khoảng trắng. Do đó, 1000 ký tự chiếm khoảng 2/5 trang, 2000 ký tự ─ 4/5 định dạng A4.
- Stella Pajunas-Garnand là người đánh máy nhanh nhất thế giới. Năm 1946, cô đạt 1080 ký tự mỗi phút trên máy đánh chữ điện của IBM. Người chiến thắng hiện đại, người Anh Barbara Blackburn, đã không phá được kỷ lục này trên bàn phím máy tính. Vào năm 2005, cô ấy đã gõ 1060 ký tự trong một phút.
- Tốc độ nhập trung bình là khoảng 200 ký tự mỗi phút. Hóa ra đàn ông gõ nhanh hơn phụ nữ, mặc dù họ phải gõ ít thường xuyên hơn.
- Có 150.000 từ trong Từ điển học thuật lớn.
Trong thế kỷ 21 thông tin, tất cả dữ liệu văn bản được dịch sang dạng kỹ thuật số và sang các ngôn ngữ khác nhau. Trong trường hợp các tác phẩm nghệ thuật và biên niên sử lịch sử, việc dịch thuật và chỉnh sửa được giao cho các chuyên gia, còn đối với các văn bản không quan trọng, có các thuật toán tự động được tích hợp trong trình dịch trực tuyến và “bộ đếm ký tự”. Cái sau “có thể” đếm không chỉ số ký tự (có và không có khoảng trắng), mà còn cả số đoạn, từ (đơn tiết và đa tiết), âm tiết, câu, đoạn, v.v. Điều này giúp đơn giản hóa rất nhiều công việc với văn bản / ngôn ngữ thông tin và cho phép bạn tự động đưa thông tin đó về dạng phù hợp mà không cần sử dụng từ điển.