Online karakter- és szószámláló eszköz
Ma 7150 nyelv van a világon, amelyek 142 nyelvcsaládhoz tartoznak. Különböző történelmi korokban keletkeztek és fejlődtek, átalakult és kész formájukban a mai napig fennmaradtak. De az ekkora nyelvi sokszínűség nem mutató, mert a világ lakosságának csaknem 70%-a csak 40 nyelvet használ, a fennmaradó 7110 nyelv túlnyomó többsége pedig veszélyeztetett.
Az írás története
A beszéd és az írás fejlődésének kezdete - mai felfogásunk szerint - az első piktogramos szimbólumok és hieroglifák megjelenésének nevezhető: a Kr.e. V-VI. században. A régészeti kutatások során Mezopotámiában, a szír-palesztin térségben, a modern Abházia területén és a Sárga-folyónál Kínában kerültek elő. Ezek az írások az úgynevezett "proto-íráshoz" tartoznak, és csak a Kr.e. 3-2.
Így a "valódi" írások strukturált szimbólumok formájában megjelentek az ókori Egyiptomban ie 3100-ban, Északnyugat Hindusztánban i.e. 3000-ben, és az ókori Sumerben, ie 2750-ben. A Peruban (i.e. 2500), Krétán (i.e. 2000) és Kínában (i.e. 1400) talált írások későbbi évekre nyúlnak vissza. Kr.e. 1000 és 100 között létrejött a kisázsiai ábécé, az etruszk ábécé, a héber négyzetes írás és a Nabat írás. Ami a latin ábécét illeti – ma a legelterjedtebb, az etruszktól származik: Kr.e. 400 körül.
A világírás egyik mérföldkőnek számító eseménye a papír Kínában történő feltalálása volt, nagyjából Krisztus születésével egy időben (i.sz. 0). Univerzális, és legfőképpen mobil információhordozóvá vált: a terjedelmes kőtáblákkal és teknőspáncélokkal ellentétben először az elit, majd a középosztály körében terjedt el.
Az ázsiai írással párhuzamosan az európai írás a Római Birodalomban elfogadott latin ábécé alapján fejlődött ki. Modern formáját azonban csak 1300-ban érte el, amikor a Karoling-minuscule újjáéledt, és jóváhagyták az úgynevezett „humanista” írásmódot. 1700-ban Oroszországban elfogadták a cirill ábécét (I. Péter „polgári írása”), és a 19. században megkezdődött a latin ábécé globális adaptációja más nyelvekre. A mai napig ez a leggyakoribb, és 195 országból 131-ben használják.
Érdekes tények
- A létező 7150 nyelv túlnyomó többsége (90%) csak Afrikában és Ázsiában hallható. Összesen 90-100 ezer ember beszéli őket. Ezeket a dialektusokat veszélyeztetettnek tekintik, és évtizedenként csökkentik őket.
- A világtörténelem egyik legkiemelkedőbb poliglottja Giuseppe Gasparo Mezzofanti olasz bíboros volt, aki 60 nyelven beszélt.
- A világon a leggyakoribb karakter a latin "e" betű. Különösen azért, hogy csökkentse jelentőségét és megcáfolja nélkülözhetetlenségét, Ernest Vincent Wright 1939-ben írta meg a Gadsby című regényt, amely 50 ezer szóból áll, és nem tartalmazza ezt a levelet.
- A legnagyobb karakterkészlet a kínai nyelvben van: több mint 80 000. De szinte mindegyiket nem használják a mindennapi életben, és ahhoz, hogy a sajtóban és az interneten írottak 99%-át megértsük, elég csak tudni 2000 karakter. A megértés 80%-ához pedig 500 hieroglifa is elég.
- Ha a betűméret 12 pont, akkor egy szabványos A4-es oldal átlagosan 2400 karaktert fér el szóközök nélkül. Így 1000 karakter az oldal körülbelül 2/5-ét, 2000 karakter ─ 4/5-ét az A4-es formátumnak.
- Stella Pajunas-Garnand volt a leggyorsabb gépelés a világon. 1946-ban elérte az 1080 karakter/perc sebességet egy IBM elektromos írógépen. A modern győztesnek, az angol Barbara Blackburnnek nem sikerült megdönteni ezt a rekordot számítógépes billentyűzeten. 2005-ben 1060 karaktert írt le egy perc alatt.
- Az átlagos gépelési sebesség körülbelül 200 karakter percenként. Kiderült, hogy a férfiak gyorsabban gépelnek, mint a nők, bár ritkábban kell gépelniük.
- 150 000 szó található a Big Academic Dictionary-ben.
A 21. században az összes szöveges adatot lefordítják digitális formára és különböző nyelvekre. Műalkotások és történelmi krónikák esetében a fordítást és a szerkesztést szakemberekre bízzák, a lényegtelen szövegeknél pedig az online fordítókba épített automatikus algoritmusok és a „karakterszámlálók”. Ez utóbbi nem csak a karakterek számát (szóközzel és szóköz nélkül), hanem a bekezdések, szavak (egy- és többszótagú), szótagok, mondatok, bekezdések stb. számát is meg tudja számolni. Ez nagyban leegyszerűsíti a szöveggel/nyelvvel végzett munkát. információkat, és lehetővé teszi, hogy azokat automatikusan és szótár használata nélkül a megfelelő formába hozza.