Arabiska alfabetet

Från Wikipedia
Hoppa till: navigering, sök
Spridning av det arabiska alfabetet. I mörkgröna områden används enbart arabiska alfabetet; i ljusgröna områden används det parallellt med andra skriftspråk.
”Arabiska”, skrivet med det arabiska alfabetet.

Arabiska alfabetet används för att skriva det arabiska språket, liksom ett antal andra språk som persiska, urdu och uiguriska. Det har historiskt sett används för att skriva ett större antal språk.

Det arabiska alfabetet skrivs från höger till vänster. Bokstäverna i ett ord skrivs vanligen samman så att de blir en sammanhängande enhet. Rent praktiskt använder man vid typsättning initiala (oftast längst till höger i ordet), mediala och finala (oftast längst till vänster i ordet) former för respektive bokstav (till skillnad från dess isolerade form). Vissa bokstäver har dock inga initiala och mediala former (se nedan), men kan förekomma i början eller mitt i ord ändå. Då används den självständiga respektive den avslutande formen. Tecknet efter ska då inte heller bindas med det föregående.

Det arabiska alfabetet är en abjad, det vill säga en konsonantskrift där vokaler är frivilliga och markeras med diakritiska tecken. Det är dock inte en "ren" abjad; långa vokaler skrivs med några få undantag alltid ut men inte de korta.

Ordning[redigera | redigera wikitext]

De arabiska bokstäverna kan sorteras på två olika sätt. Den ursprungliga abjadī-ordningen härstammar från det feniciska alfabetet och påminner därför om bokstavsordningen i exempelvis hebreiska. Hijāʼī-ordningen grupperar tecken med liknande utseende. Abjadī används vid numrering medan hijāʼī används då listor över namn eller ord ska sorteras, exempelvis telefonkataloger och ordlistor.

Bokstäver[redigera | redigera wikitext]

placering i ordet namn transkription uttal
isolerat finalt medialt initialt
ʾalif ʾ, ā [a:]
bāʾ b [b]
tāʾ t [t]
ṯāʾ ṯ, th [θ]
ǧīm ǧ, j, dj [dʒ]
ḥāʾ [ħ]
ḫāʾ ḫ, ẖ, kh, x [x]
dāl d [d]
ḏāl ḏ, dh, ð [ð]
rāʾ r [r]
zai z [z]
sīn s [s]
šīn š, sh [ʃ]
ṣād [sˁ]
ﺿ ḍād [dˁ]
ṭāʾ [tˁ]
ẓāʾ [ðˁ]
ʿayn ʿ [ʕ]
ġayn ġ, gh [ɣ]
fāʾ f [f]
qāf q [q]
kāf k [k]
lām l [l]
mīm m [m]
nūn n [n]
hāʾ h [h]
wāw w, ū [w], [u:]
yāʾ y, ī [j], [i:]
  • Ursprungligen stod bokstaven ʾalif för en glottal stöt. Numera används den i likhet med yāʾ och wāw för att representera en lång vokal.
  • Numera skrivs glottal stöt med hamza. Den skiljer sig från andra bokstäver genom att den både kan skrivas ensam (ء) och som ett diakritiskt tecken (ؤ ,ئ ,أ ,إ).

Vokaler[redigera | redigera wikitext]

Korta vokaler[redigera | redigera wikitext]

Korta vokaler skrivs i arabiska med diakritiska tecken kallade harakat ovanför eller under föregående konsonant.

För att markera att en konsonant inte följs av en vokal kan den markeras med ett sukūn.

med ب namn transkription uttal
بَ fatḥa a [a]
بُ ḍamma u [u]
بِ kasra i [i]

Långa vokaler[redigera | redigera wikitext]

Långt a skrivs, efter alla konsonanter utom hamza, med tecknet för kort a följt av ett ʾalif. Långt i skrivs med tecknet för kort i följt av ett yāʾ. Långt u skrivs med tecknet för kort u följt av ett wāw.

I texter där korta vokaler inte skrivs ut så representeras de långa vokalerna av enbart konsonanttecknen ʾalif, yāʾ och wāw. Ett viktigt undantag är den bestämda artikeln al där a uttalas kort trots att den skrivs med ʾalif.

med ب namn transkription uttal
بَا fatḥa ʾalif ā [a:]
بَى fatḥa ʾalif maqṣūra ā, aỳ [a:]
بُو ḍamma wāw ū, uw [u:]
بِي kasra yāʾ ī, iy [i:]

Siffror[redigera | redigera wikitext]

I arabiskan finns det två sorters siffror: standardarabiska samt det ostliga skrivsättet som används i Iran, Pakistan samt i Indien. I Maghreb används samma siffror som i Europa.

Siffror skrivs från vänster till höger och skrivs alltså inte åt samma håll som bokstäverna.

Maghrebarabiska Standardarabiska Östligt skrivsätt
0 ٠ ۰
1 ١ ۱
2 ٢ ۲
3 ٣ ۳
4 ٤ ۴
5 ٥ ۵
6 ٦ ۶
7 ٧ ۷
8 ٨ ۸
9 ٩ ۹

Hantering i datorer[redigera | redigera wikitext]

Teckenkodningen Unicode stöder det arabiska alfabetet. Det finns teckenkoder både för nominella arabiska bokstäver (som ska formas vid utskrift, så att de binds ihop med intilliggande bokstäver) och även för förformade bokstäver och ligaturer. De förformade arabiska bokstäverna finns med som teckenkoder för kompatibilitet med äldre teckenstandarder, och bör inte användas i nyskrivna texter. De nominella bokstäverna skrivs ut med olika utformning, och eventuellt olika placering i höjdled, beroende på intilliggande bokstäver. Moderna fonter (enligt till exempel OpenType eller AAT) för arabiska innehåller flera former för varje nominell arabisk bokstav (plus ev. ankarpunkter för placering i höjdled), och utskriftsystemet väljer form beroende på grannbokstäver. Teckenkoderna för de förformade bokstäverna används då inte, och en hel del utökade arabiska bokstäver har inga kodpunkter för förformade varianter. Även ligaturer, speciellt för den obligatoriska lam-alif-ligaturen, formas med hjälp av data i fonten, inte via teckenkoder för arabiska ligaturer.

En annan svårighet är att skrivriktningen för arabisk text är från höger till vänster. Enligt Unicode ska arabisk text lagras i läsordning, och sedan skrivas ut höger-till-vänster. Så om en text bara innehåller arabiska bokstäver och några skiljetecken är det lätt, man vänder på tecknens ordning vid utskrift (om man måste skriva ut från vänster till höger), eller helt enkelt skriver ut dem höger-till-vänster, samtidigt som vissa tecken, bl.a. parenteser, speglas. Men om texten även innehåller, till exempel, ord skrivna i ett alfabet där skrivriktningen är vänster-till-höger, nummer, även arabiska nummer, blir det mer komplicerat. Unicode-standarden innehåller en, tyvärr ganska komplicerad, algoritm för detta som datorutvecklare kan använda. Resultatet blir inte alltid perfekt, så det finns även styrkoder med vars hjälp utskriften kan förbättras, till exempel för parenterser, citat och dylikt. I HTML finns istället attribut för detta som bör användas i stället för styrkoderna.

Även äldre 8-bitskodningar för arabiska bokstäver och siffror finns, som använts före Unicode och delvis fortfarande, till exempel ISO/IEC 8859-6. Det stödjer engelska och arabiska, men inte fullt ut persiska, urdu m.fl.