Wikipediadiskussion:Sortering

Sidans innehåll stöds inte på andra språk.
Från Wikipedia

Riktlinje?[redigera wikitext]

Hej! Den här användaressän är baserad på text skriven av Roufu. Den täcker information och rekommendationer som jag inte sett någon annanstans. Därför har jag på förslag länkat till den under rubriken "Struktur" på wp:POLICY. Det vore toppen om fler kunde kommentera och putsa på den. Kanske finns info på annat ställe? Annars tror jag att essän har potential att kunna uppgraderas till riktlinje. Mvh.---Paracel63 (diskussion) 14 februari 2015 kl. 18.38 (CET)[svara]

Jag stöder förslaget om att uppgradera essän till riktlinje. Definiendum (?) 14 februari 2015 kl. 19.07 (CET)[svara]
Nej, den behöver bearbetas mer först. Delar är fortfarande i jagform.
andejons (diskussion) 14 februari 2015 kl. 20.01 (CET)[svara]
@Andejons: Instämmer. Nu är "jag" borta ur texten. Vad tycker du mer ska fixas – struktur, rekommendation eller något annat?--Paracel63 (diskussion) 15 februari 2015 kl. 00.00 (CET)[svara]
Det är flera månader sedan jag skrev det här, och Paracel63 har bearbetat framför allt den formella presentationen. Jag-formen finns kvar i sista avsnittet, som handlar om olösta problem, och frågan är vad det skall stå om sådana i en officiell riktlinje.
När jag skrev texten, var det viktigaste för mig att slå fast att det är artikelnamnen som sorteras, inte vad personerna egentligen heter. Clark Olofsson exemplifierar detta i texten. En annan liknande person, "Bildsköne Bengtsson" bör därför standardsorteras som "Bengtsson, Bildsköne" och inte som "Bengtsson, Harald", som varit fallet tills nu. Jag vet att detta uppfattas som kontroversiellt av somliga, och betonar det därför här. En förgreningssida för numera rätt, om man skriver "Harald Bengtsson". Roufu (diskussion) 14 februari 2015 kl. 22.45 (CET)[svara]
Jo, det var i april förra året jag fick ditt mejl. Själv tycker jag fortfarande att detta kapitel förtjänar en fördjupning, och därför har jag nu länkat till texten härifrån. Men antagligen förtjänar texten att bli lite tydligare i sin rekommendation, vilket vi förhoppningsvis kan få till om fler deltagare ansluter till den här diskussionen. :-)--Paracel63 (diskussion) 15 februari 2015 kl. 00.00 (CET)[svara]
Sen är jag inte säker på om inte detta hör hemma i Wikipedia:Personnamn. Det mesta finns redan täckt där.
andejons (diskussion) 15 februari 2015 kl. 08.16 (CET)[svara]
Jag håller med. Här fanns en del om märkligheter i sorteringen som jag tog bort: vad jag förstår är de inte längre aktuella (en snabb test med sortering à la LANG=sv_SE, som väl ger samma algoritm som MediaWiki, motsade de tidigare exemplen). Jag ser inte något som inte finns (eller kunde finnas, om något saknas) i Wikipedia:Personnamn eller Wikipedia:Kategorier. --LPfi (diskussion) 15 februari 2015 kl. 16.22 (CET)[svara]
LPfi tar bort mitt exempel om sorteringen av "Ask" och "Ask-Upmark", men kontrollerar inte i "Kategori:Män" att det faktiskt är korrekt. Orsaken till det icke-intuitiva resultatet med "Ask-Upmark" först är kommatecknet efter efternamnet. Det som jämförs är egentligen "Ask," och "Ask-Upmark,". Om man utelämnade kommatecknet, skulle sorteringen bli riktig, men en ändring av konventionerna på denna punkt är en mycket stor åtgärd. Detta kunde självklart göras tydligare i texten. Jag minns inte om jag hade förstått orsaken i våras för ett år sedan, när jag skrev e-posten till Paracel63.
Ett problem med adelsprefixen "von" och "af", som alltid skrivs med liten bokstav, är att det blir fel resultat om de inkluderas som i "Rosen, Robert von" och "Rosen, Robert Magnus von", där "Robert Magnus" sorteras före "Robert". Riktig sortering får man om "von" utelämnas från sorteringssträngen. Detta bör också med i texten. Roufu (diskussion) 15 februari 2015 kl. 20.46 (CET)[svara]
Hoppsan! Det var slarvigt av mig att anta att sorteringen här följer samma regler som på min dator (samma programbibliotek torde användas, och jag antog att också samma sorteringsstandard används) - jag är ovan vid jättekategorier och orkade inte bläddra ner till As.
Jag frågar mig då genast vilken standard vi använder. Problemet med af och von är ännu märkligare: om "Robert von" sorteras efter "Robert Magnus" så verkar det ju som om gemener/versaler ges större tyngd än den alfabetiska ordningen, vilket sällan förekommer annars (annat än i triviala algoritmer, såsom den som tidigare användes).
von-problematiken botas inte genom vettig sorteringsalgoritm, då "Robert Fredrik von", "Robert von" och "Robert Wulf von" knappast skall sorteras i den ordningen. Borde de inte sorteras à la "Rosen af, ..."?
Hur som helst handlar den här problematiken om namn, och hör hemma i Wikipedia:Personnamn#Sortering. Vi har förhoppningsvis inte så många specialfall att de behöver en skild riktlinje.
--LPfi (diskussion) 17 februari 2015 kl. 13.02 (CET)[svara]
Den enklaste lösningen kan jag tycka är att plocka bort alla "af", "von" o.dy. från slutet av standardsorteringarna (ett lämpligt robotjobb) eller alternativt lägga till ett komma framför ({{STANDARDSORTERING:Kraemer, Robert Fredrik, von}}). /ℇsquilo 17 februari 2015 kl. 13.55 (CET)[svara]
Jag menar att man bör plocka bort "von" och "af" från sorteringssträngen. Detta är analogt med att man inte skall ha med andra bestämningar som kan förväxlas med förnamn. Ett extra kommatecken löser inte problemet. Ordmellanrum sorteras före kommatecken varför "Robert Fredrik, von" sorteras före "Robert, von", och det var det vi ville undvika. Problemet är emellertid inte särskilt stort, eftersom det bara är några få von-namn som har många bärare. Dessa bör kunna åtgärdas manuellt.
Att lösa problemen med bindestreck är svårare, eftersom de kräver större ändringar och också att Wikipedias skribenter lär sig nya regler, t.ex. att kommatecken tas bort och bindestreck ersätts med ordmellanrum i förnamn i sorteringssträngen. Möjligheten att detta läggs in i själva sorteringsalgoritmen finns dock, men är den genomförbar? Jag tror själv att vi får leva med att svenska Wikipedias sortering av personnamn inte är perfekt.
Slutligen, att bläddra i jättekategorierna är inte så svårt. Till det alfabetiska registret på varje sida finns en knapp med ordet [Visa], som ger en lista med alla tvåbokstavskombinationer. Väljer man As, finner man Ask ett stycke ner i tredje spalten på sidan som kommer upp. Men detta är inte förklarat och knappast intuitivt. Roufu (diskussion) 18 februari 2015 kl. 16.26 (CET)[svara]

(utdrag) Här har det diskuterats, ser jag. Utmärkt! Förhoppningsvis har vi kommit en bit framåt i att förstå hur MediaWiki-programvaran hanterar sortering. Jag har nu kompletterat {{Artikelnamn}} och lagt in den i alla relevanta hjälpsidor. Dessutom har jag på förslag lagt med den här essän som ett parentetiskt tillägg till Wikipedia:Personnamn i den mallen. Samt gjort en {{Fördjupning2}}-pekning från den artikelns sorteringskapitel till den här essän. Jag tror att den här artikeln kan fungera som en komplettering; om inte, är det bra om vi gemensamt kan arbeta in det relevanta härifrån i Personnamnsartikeln. Allt gott.--Paracel63 (diskussion) 22 februari 2015 kl. 14.51 (CET)[svara]

Om det här ska bli en riktlinje borde Wikipedia:Kategorier#Sortering av artiklar inom en kategori och Wikipedia:Personnamn#Sortering arbetas in här, med korta sammanfattningar på de platserna. //Essin (diskussion) 15 februari 2023 kl. 17.57 (CET)[svara]

Sortering av gamla adelsnamn[redigera wikitext]

De äldsta svenska adelsnamnen var ursprungligen sköldmärken och inte en del av namnet. De sätts därför i parentes i artikelnamnen, Bo Jonsson (Grip) är ett typiskt exempel. Han sorteras nu efter "Bo Jonsson Grip", inte efter "Grip", som inte var en del av namnet och inte efter "Jonsson", som inte var ärftligt. Avsikten med sortering är att vara till hjälp för Wikipedias läsare. Det är då mer sannolikt att man intresserar sig för personer med samma ärftliga sköldmärke än för personer med samma förnamn. Jag menar därför att sköldmärkena vid sortering av personartiklar bör likställas med senare tiders efternamn. Bo Jonsson (Grip) skulle då sorteras tillsammans med sin släkt som "Grip, Bo Jonsson". Roufu (diskussion) 26 juli 2015 kl. 16.31 (CEST)[svara]

Det vore snarare en otjänst till läsarna att hitta på egen standard för sortering. Förnamn är vad som används i andra uppslagsverk, liksom i litteratur på området. (För övrigt används bara beskrivande sköldemärken när inget senare ättenamn antagits).
andejons (diskussion) 26 juli 2015 kl. 17.23 (CEST)[svara]
Jag ser efter i Svenskt biografiskt lexikon, som jag menar är den bästa samlade källan till biografisk information om dem det gäller. Det har artiklar om "Grip, släkter" och "Natt och Dag, släkt" och behandlar individer med dessa sköldmärken tillsammans med släktartiklarna - med ett undantag, Bo Jonsson (Grip), som behandlas under bokstaven B. Ugglan gör på samma sätt. Enligt Ugglan var Bo Jonsson inte riddare, och om det är detta som gör att han behandlas annorlunda vet jag inte. Han vaf tydligen ett dåligt valt exempel. Medlemmar av Sture- och Banér-ätterna behandlas under dessa namn även dem har som har efternamnet i parentes. "Vasa" och "Tre rosor" har inte kommit med i den oavslutade SBL men behandlas samlat i Ugglan. Detta var sköldmärken och inte efternamn under medeltiden, något som också går klart fram i Ugglan. Roufu (diskussion) 26 juli 2015 kl. 23.37 (CEST)[svara]
Det verka faktiskt som även NE sortera på ättenamn (och det är bara i vissa fall rena beskrivningar av vapnet som för; i huvudsak är det senare antagna ättenamn som då vanligen är baserade på märket. I andra fall är det faktiskt använda ättenamn som i familjerna Trolle och Bonde). All annan litteratur jag har sorterar dock på förnamn vad jag ser vid hastig kontroll. Kategorier som kategori:Personer i Sverige under medeltiden innehåller dessutom fler artiklar än bara adelsmän, och det skulle i sådana fall bli märkligt att blanda. Dessutom har vi fall som Sten Sture d.y. som egentligen hörde till ätten Natt och Dag.
andejons (diskussion) 27 juli 2015 kl. 20.08 (CEST)[svara]
tTvå saker: (1) Det som sorteras är artikelnamnen, inte vad personerna "egentligen" heter. För Sten Sture den yngre är frågan om Sten eller Sture skall ha prioritet i sorteringen. (2) Det verkar alltså som om de etablerade uppslagsverken "Ugglaqn", SBL och NR sorterar gamla adelsnamn på ett annat sätt än svenska Wikipedia. Det finns ytterligare några allmänna upppslagsverk, som brukar nämnas i Wikipedia. Jag gissar att ocskå dessa sorterar sturarna först som Sture och inte som Sten, Svante och Nils. Det som står mot detta är "all annan litteratur i andejons bokhylla", en typ av hänvisning som jag som wikipedian har svårt att acceptera. Konkret är frågan vilka historiska översiktsverk är det som sorterar medeltida adelsmän efter förnamn och inte efter de i vår tid etablerade ättnamnen? Roufu (diskussion) 5 augusti 2015 kl. 06.18 (CEST)[svara]
Ett urval ur min bokhylla hittar man här. I genren allmänna översiktsverk finsn t.ex. Sveriges historia.
andejons (diskussion) 5 augusti 2015 kl. 08.14 (CEST)[svara]

Ü som inte är tyskt y[redigera wikitext]

I tyska och svenska namn brukar "Ü" sorteras som "Y". Det klarar programvaran av utan problem. Men Ü förekommer också i andra språk. Till exempel som egen bokstav i turkiska Kamil Güler eller som en variant av U i spanska Dani Güiza. Hur ska de namnen sorteras? Är det annorlunda än tyska Ü? F.d. 82.212.68.183 (diskussion) 26 december 2015 kl. 14.53 (CET)[svara]

Jag kollade i Nationalencyklopedin. Där sorteras både spanska namn (Ricardo Güiraldes, fast uttalet mer liknar u än y) och ord med turkiskt ursprung (gül) som GY... Nordisk familjebok (Ugglan) gör likadant (José Güell y Rente (uttalas Guelj), Gümürdzina). Jag tycker vi gör likadant här och låter programvaran sköta sorteringen av Ü som Y.
Jag såg också att båda sorterar tyska namn med OE som OE, inte som Ö som en del artiklar här gör (Goebbels, Goette). F.d. 82.212.68.183 (diskussion) 27 december 2015 kl. 11.09 (CET)[svara]
En gammal diskussion, från innan programvaran lärde sig hantera ü som y. Diskussionen då kom aldrig fram till något klart besked om hur en:Ü#U-diaeresis konventionellt sorteras på svenska, men om dina belägg representerar en allmän princip verkar det som att jag hade fel i mitt antagande att det sorteras som u. //Essin (diskussion) 27 december 2015 kl. 12.56 (CET)[svara]
Ett exempel från NE (jag hittar inte fler) är inte så mycket. Det passar dock med deras bokstav-för-bokstav-princip, att bara genom att titta på bokstäverna i det fetstilta uppslagsordet ska det gå att sortera. Principen fungerar inte lika bra om man måste ta hänsyn till vilket språk som används.
Jag tror samma princip skulle fungera bra på Wikipedia. I svenska och tyska namn där Ü är vanligast sorteras det som Y som de flesta svenskspråkiga förväntar sig. Enligt principen och för enkelhets skull sorteras det som Y för andra språk också, även om det (t.ex. i spanska namn) inte är lika självklart och kanske inte helt korrekt. F.d. 82.212.68.183 (diskussion) 27 december 2015 kl. 15.26 (CET)[svara]
Praxis anger att vi inte använder specialtecken i sorteringen. Det finns ingen anledning att frångå detta, trots att det nu skall kunna hanteras av programvaran. Jag återställer alla ändringar jag hittar. Tostarpadius (diskussion) 28 december 2015 kl. 16.27 (CET)[svara]
Grundproblemet kvarstår. Tyska ü motsvarar svenskt y och skall väl sorteras som sådant, medan ü i bl.a. spanskan är ett u med trema, där "¨" endast anger att u:et inte är stumt eller att det inte ingår i en diftong. Rimligen borde det sorteras som "u". Att behöva kunna tyska för att hitta spanska namn verkar märkligt, även om det också är förvirrande att sortera ett tecken olika beroende på namnets ursprung. --LPfi (diskussion) 28 december 2015 kl. 20.46 (CET)[svara]

Karlsson, Carlson, Carlzon ...[redigera wikitext]

Är det lämpligt att ange stavningsvariationer typ Karlsson, Carlson, Carlzon ... med standardsortering Karlsson? undrar Anhn (diskussion) 7 februari 2018 kl. 07.45 (CET)[svara]

Man gjorde så i telefonkatalogen, men det här är ingen telefonkatalog. -- 109.228.149.82 7 februari 2018 kl. 08.03 (CET)[svara]
Man gjorde så med en god orsak, som torde vara lika relevant här. Om man gör det konsekvent är det inte svårt att gissa var man hittar Carlssönerna. Enda orsakerna jag ser att inte göra så är att det är mer arbete (och problematiskt om det inte genomförs någorlunda konsekvent) och att det kan bli förvirrande där de "udda" varianterna är så många att det är svårt att hålla reda på var i alfabetet man är. Jag tror båda problemen är små. --LPfi (diskussion) 7 februari 2018 kl. 12.07 (CET)[svara]
Hm. Med vissa namn kan det också vara svårt att avgöra vad som är den normala formen. Jag vet inte om problemet är tillräckligt vanligt för att väga tungt. --LPfi (diskussion) 7 februari 2018 kl. 12.09 (CET)[svara]
Ja, orsaken var god, men det är inte alltid man gjort så i uppslagsverk, och det är väl mer deras standard vi bör följa. Ett undantag jag kan tänka mig är väl alla kungar med namnet "Carl/Karl/Charles/etc". -- 109.228.149.82 7 februari 2018 kl. 15.22 (CET)[svara]
Inte ens där verkar fullständig konsekvens helt lämpligt. Förutom att han inte är en av de mer kända kungarna skulle nog få svenskar leta efter Hans under "Johan", trots att det bland annat var han som fick Johan III att anta det numret.
andejons (diskussion) 7 februari 2018 kl. 15.42 (CET)[svara]
I efternamnsartikeln Karlsson är alla stavningsvarianter behandlade likt, men den sorteringen har gjorts manuellt. Min erfarenhet är att innan jag rättat har cirka 2  % av standarsorteringarna varit fel. Jag håller med LPfi att det skulle bli för osäkert om man gjorde standarsorteringen efter något annat än namnet så som det faktiskt är stavat i titeln. Det är naturligt att avgränsa varianter efter uttalet, inte etymologin, men hur gör man med Petersson och Petterssom , Arfvedsson och Arvidsson, Beckman och Bäckman? Vem avgör om uttalen sammanfaller eller inte? Roufu (diskussion) 9 februari 2018 kl. 05.27 (CET)[svara]

Azerbadzjanska Ə[redigera wikitext]

Azerbazjanska skrivs med latinska bokstäver. Utöver de vanliga bokstäverna används "Ə" som är ett av få tecken som programvaran inte sorterar riktigt bra. Hur bör det tecknet sorteras? Programvaran sorterar som en bokstav efter E men före F. I några artiklar har det standardsorterats som A (Leyla Əliyeva (programledare)) i andra som Ä (Vahid Ələkbərov). Det finns också artiklar där namn transkriberats till det svenska alfabetet (Dilara Alijeva). Är det ett sätt att kringgå sorteringsproblem? Eller bör det undvikas nu när Unicode gör det lättare att använda "rätt" tecken? I andra fall används transkribering bara i standardsorteringen så att även "y" ändras till "j" (Leyla Əliyeva pga sidflytt utan ändrad standardsortering). Det verkar fel eftersom "y" i svenska har en vanlig svensk sortering.
Vilka tecken som används i sidtiteln antar jag kan variera beroende på hur namnet normalt skrivs i svensk text. Men om "Ə" används borde det sorteras på samma sätt, gärna genom att programvaran uppdateras, men annars med enhetliga standardsorteringar. /90.227.175.244 26 februari 2019 kl. 19.03 (CET)[svara]

Jag hittade https://ec.europa.eu/info/sites/info/files/transliteration_alt_geogr_names_sv.pdf för översättare inom EU. Där står att de ersätter Ə med Ä i svensk text, alltså Artur Rasizadä i stället för Artur Rasizadə. Med en del undantag för personer som är kända Europa under en viss stavning, t.ex. Ilham Aliyev eller Gejdar Alijev. Det behöver kanske inte Wikipedia följa, men det tyder på att artikelnamn som använder Ə bör ha Ä i sorteringen. F.d. 82.212.68.183 (diskussion) 5 januari 2021 kl. 13.48 (CET)[svara]

Gårdsnamn och patronymikon[redigera wikitext]

Det framgår ingenstans hur tanken är vad gäller personer med patronymikon och gårdsnamn? Skall de sorteras på förnamnet eller på gårdsnamnet?FBQ (diskussion) 4 mars 2020 kl. 11.31 (CET)[svara]

y eller ü i standardorterings-mallen?[redigera wikitext]

Flyttad från Wikipedia:Bybrunnen 5 januari 2021 kl. 12.30 (CET).

En fråga när det gäller hur man fyller i STANDARDSORTERING-mallen: Om ett namn innehåller bokstaven ü, som i exempelvis Herta Müller, ska man i så fall skriva {{STANDARDSORTERING:Müller, Herta}} eller {{STANDARDSORTERING:Myller, Herta}}? I de stickprov jag har gjort, används bara den förstnämnda varianten, men blir sorteringen rätt då? Stigfinnare (diskussion) 29 december 2020 kl. 00.08 (CET)[svara]

Programvaran sorterar ü som y, även æ och ø sorteras rätt och kräver ingen specialare. Ett undantag är när æ ingår i latiniserade namn, då måste det särskrivas ae, annars blir det sorterat som ä. --北山 Kitayama (diskussion) 29 december 2020 kl. 00.27 (CET)[svara]
ü förekommer också som u med trema, såsom i Güijasjön eller Güeirat (spansk respektive fransk stavning antar jag). Dessa bör sorteras som "u", inte som "y" som i tyskan (och i svenskan, för här är det främst tyska namn som har bokstaven). Turkiskan verkar också att ha en hel del "ü", jag vet inte hur de skall behandlas. –LPfi (diskussion) 29 december 2020 kl. 01.24 (CET)[svara]
(Sedan ett antal år använder programvaran svensk sortering på sv-wp, så svenska ord sorteras rätt också då de har märkliga bokstäver – men då samma bokstav har olika funktion i olika språk, som här, måste man lägga in standardsortering för de språk där bokstaven har annan funktion.) –LPfi (diskussion) 29 december 2020 kl. 01.35 (CET)[svara]
ü på spanska är ett u med trema, ett diakritiskt tecken som talar om att u:et ska uttalas och inte vara stumt. Det ska betraktas som en accent. ü på franska betyder att u:et inte ska uttalas ihop med omgivande vokaler utan för sig själv. Det är då också ett diakritiskt tecken. ü på tyska och turkiska är en egen bokstav med ett eget ljud motsvarande vårt y. I tyskan sorteras det ihop av språkhistoriska skäl. Var ska detta preciseras i alla instruktioner? Per W (diskussion) 29 december 2020 kl. 10.33 (CET)[svara]
Tillåter Per W att jag kommer med ett förtydligande? ”I tyskan sorteras ü ihop med u av språkhistoriska skäl” blir lättare att förstå. Jan Arvid Götesson (diskussion) 29 december 2020 kl. 10.44 (CET)[svara]
Wikipedia:Sortering, med länk och eventuellt sammandrag på sidor som nämner sortering eller standardsortering, antar jag.Skall turkiska ü sorteras ihop med y, såsom i svenskan? –LPfi (diskussion) 29 december 2020 kl. 10.48 (CET)[svara]
Att programvaran numera sorterar ü som y, betyder det att de flesta av de standardsorteringar, se nedanstående sökning, som manuellt har ändrats till y för att få den sorteringen bör justeras?
  • Sökning efter kommentaren <!--svenskt y för rätt sortering-->?
--Larske (diskussion) 29 december 2020 kl. 11.30 (CET)[svara]
De behöver ju inte justeras då det blir rätt ändå (om inte någon är på extremt städhumör). Värre är det med de ü som ska sorteras som u (spanska och franska). Där behöver ju standardsorteringen manuellt ändras från ü till u. Kanske kan göras ett urval baserat på land/nationalitet i WD? Inte perfekt, men en god början. --北山 Kitayama (diskussion) 29 december 2020 kl. 11.36 (CET)[svara]
Ett snabb fråga på svwp-artiklar om spanjorer och fransmän med ü i sidnamnet ger följande resultat:
Men även om jag filtrerat bort alla tyskar kan väl även spanjorer och fransmän ha tyska, eller svenska eller japanska, namn, så det måste avgöras från fall till fall om ü ska ändras till u i sorteringsnyckeln för dessa artiklar.
--Larske (diskussion) 29 december 2020 kl. 12.55 (CET)[svara]
Den första frågan med åtta fixad. Per W (diskussion) 29 december 2020 kl. 13.29 (CET)[svara]
Ett förslag: även om programvaran kan hantera tyska ü, så bör det ändå standardsorteras med "y" där det förekommer, så att det går att göra körningar och hitta "obedömda" personer. På liknande sätt bör göras med æ. Då slipper man kanske göra den här typen av sökningar framöver.
andejons (diskussion) 5 januari 2021 kl. 13.28 (CET)[svara]