Wikisage is op 1 na de grootste internet-encyclopedie in het Nederlands. Iedereen kan de hier verzamelde kennis gratis gebruiken, zonder storende advertenties. De Koninklijke Bibliotheek van Nederland heeft Wikisage in 2018 aangemerkt als digitaal erfgoed.
- Wilt u meehelpen om Wikisage te laten groeien? Maak dan een account aan. U bent van harte welkom. Zie: Portaal:Gebruikers.
- Bent u blij met Wikisage, of wilt u juist meer? Dan stellen we een bescheiden donatie om de kosten te bestrijden zeer op prijs. Zie: Portaal:Donaties.
Alfabetisch sorteren: verschil tussen versies
(accenten, IJslands, Esperanto, Spaans) |
(ij) |
||
Regel 17: | Regel 17: | ||
==Familienamen== | ==Familienamen== | ||
Een advies van de [[Taalunie]] | Een advies van de [[Taalunie]] uit 2006 luidde:<ref>volgens Taaladvies.net</ref> | ||
„Voor een gewone lijst met namen (bijvoorbeeld klanten of personeelsleden) adviseren wij om de familienaam in zijn geheel vooraan te laten staan en de spaties te negeren. Wij raden af om rekening te houden met spaties (en eventuele apostrofs) in de familienaam, want dit zou tot gevolg hebben dat een naam als ''Van den daele'' vóór ''Vande Kerckhove'' komt te staan. | „Voor een gewone lijst met namen (bijvoorbeeld klanten of personeelsleden) adviseren wij om de familienaam in zijn geheel vooraan te laten staan en de spaties te negeren. Wij raden af om rekening te houden met spaties (en eventuele apostrofs) in de familienaam, want dit zou tot gevolg hebben dat een naam als ''Van den daele'' vóór ''Vande Kerckhove'' komt te staan. | ||
Regel 72: | Regel 72: | ||
Speciale regels waren soms in gebruik voor [[ligatuur (typografie)|ligaturen]], letters die samen als één letter werden geschreven of in één loodvorm werden gegoten. | Speciale regels waren soms in gebruik voor [[ligatuur (typografie)|ligaturen]], letters die samen als één letter werden geschreven of in één loodvorm werden gegoten. | ||
*De lettercombinatie IJ in Nederlandse woorden werd vroeger wel meer bij de Y gesorteerd, of soms apart na de Y. (In de volgorde Y, IJ, Z.) Dat wierp dan weer de vraag op waar men namen zoals Dijon sorteert. De ’ij’ is in die plaatsnaam geen Nederlandse ’IJ’-klank of geen letter Y, maar een I en een J.<br/>Vandaag wordt IJ meestal als aparte letters gesorteerd (volgorde II, IJ, IK). Een uitzondering zijn telefoonboeken | *De lettercombinatie IJ in Nederlandse woorden werd vroeger wel meer bij de Y gesorteerd, of soms apart na de Y. (In de volgorde Y, IJ, Z.)<ref>De ''Winkler Prins''-encyclopedie zette het in de volgorde X, IJ, Y, Z.</ref> Dat wierp dan weer de vraag op waar men namen zoals Dijon sorteert. De ’ij’ is in die plaatsnaam geen Nederlandse ’IJ’-klank of geen letter Y, maar een I en een J.<br/>Vandaag wordt IJ meestal als aparte letters gesorteerd (volgorde II, IJ, IK). Een uitzondering zijn telefoonboeken: omdat de y bewaard is gebleven in vele familienamen waar de moderne spelling ij zou gebruiken, staat de ij in Nederlandse telefoonboeken bij de y gesorteerd. In Nederlandstalige telefoonboeken uit België staat de ij gesorteerd als een i en een j, dus tussen ii en ik. | ||
*In het Frans wordt de ''Œ'' gesorteerd als ''OE'', hoewel de ''Œ'' een heel andere functie vervult dan ''OE''. | *In het Frans wordt de ''Œ'' gesorteerd als ''OE'', hoewel de ''Œ'' een heel andere functie vervult dan ''OE''. | ||
Regel 88: | Regel 88: | ||
{{Appendix}} | {{Appendix}} | ||
[[Categorie:Alfabet| Volgorde]] | [[Categorie:Alfabet|Volgorde]] |
Versie van 17 apr 2013 12:36
Alfabetisch sorteren is het ordenen van gegevens in de volgorde van het alfabet. In het Latijnse alfabet zoals dat ook voor de Nederlandse taal wordt gebruikt, zijn er 26 letters. Deze hebben een vaste volgorde. Het alfabetisch rangschikken van lemma’s in woordenboeken en encyclopedieën of van archiefstukken in een archief, vereenvoudigd het opzoeken.
Sorteren met de computer
Tegenwoordig worden vele gegevens met de computer gesorteerd. Computers gebruiken een vorm van de ASCII-code, of uitgebreide vorm ervan, in mindere mate EBCDIC en vandaag de dag steeds meer Unicode. Gegevens kunnen hierop worden gesorteerd, maar sorteren op ASCII-waarde van de tekens is geen volledige alfabetische sortering.
Per woord of per letter
Bij het sorteren van woordgroepen; kan men op twee manieren te werk gaan:
- Woord voor woord (vooral in registers). Er wordt eerst gesorteerd op het eerste woord; pas daarna op het volgende woord.
- Voorbeeld: De Bilt, De Panne, De Wilgen, Dedemsvaart, Den Haag, Den Helder, Dendermonde, Deurne, Deventer
- Letter voor letter (vooral in woordenboeken). Spaties worden genegeerd.
- Voorbeeld: De Bilt, Dedemsvaart, Dendermonde, Den Haag, Den Helder, De Panne, Deurne, Deventer, De Wilgen
Nummers
Bij het gebruik van cijfers zijn verschillende benaderingen mogelijk. In sommige situaties worden cijfers apart gesorteerd, voor of na de letters van het alfabet. (Bijvoorbeeld het sorteren van firmanamen in een leveranciers- of klantenbestand) Wanneer cijfers gebruikt worden om een letter voor te stellen (zoals in de filmtitel Se7en), wordt wel eens gedaan alsof er gewoon die letter staat. Een jaartal als 1492 kan in een index soms ook gesorteerd zijn alsof het uitgeschreven zou zijn als „veertienhonderd tweeënnegentig”.
Romeinse cijfers die bijvoorbeeld het nummer van koningen of pausen aanduiden, worden niet op hun alfabetische rangorde gesorteerd, maar op hun numerieke volgorde. Lodewijk IV komt dus niet voor Lodewijk XIV.
Familienamen
Een advies van de Taalunie uit 2006 luidde:[1]
„Voor een gewone lijst met namen (bijvoorbeeld klanten of personeelsleden) adviseren wij om de familienaam in zijn geheel vooraan te laten staan en de spaties te negeren. Wij raden af om rekening te houden met spaties (en eventuele apostrofs) in de familienaam, want dit zou tot gevolg hebben dat een naam als Van den daele vóór Vande Kerckhove komt te staan.
- Toelichting:
- bij het alfabetisch ordenen is er in grote trekken keuze tussen letter-voor-letter-ordening of woord-voor-woord-ordening.
- Bij letter-voor-letter-ordening worden de spaties en apostrofs genegeerd. Daarbij geldt ook dat „niets komt voor iets”, dus Vandevel komt voor Vandevelde. Deze ordening komt vooral in woordenboeken voor.
- Bij woord-voor-woord-ordening staan alle termen die met hetzelfde woord beginnen bij elkaar, en wordt op het tweede woord gealfabetiseerd. Deze ordening is gebruikelijk in registers. Hier wordt het koppelteken genegeerd.
- In Vlaanderen worden voorvoegsels als de, van, ter, van de, als vaste onderdelen van de naam gezien, zoals onveranderlijk vastgelegd in de burgerlijke stand. Namen met zulke voorvoegsels worden onder de letter van het voorvoegsel geïndexeerd. Luc De Vos staat bij de D, net als Luc Devos.
- In Nederland worden de voorvoegsels achter de voornaam gezet en klein gespeld. Er wordt dan op het kernwoord geïndexeerd, behalve natuurlijk als het voorvoegsel aan de naam vastzit. Luc De Vos komt hier bij de V, terwijl Luc Devos bij de D komt.
- Volgens de conventies die gelden voor literatuurlijsten, komen los geschreven voorzetsels en lidwoorden (van, de,..) die deel uitmaken van de familienaam, achteraan te staan.
- Er is een tendens om de letter-voor-letter-ordening steeds meer voorrang te laten geven, mede omdat computerprogramma's daarop sorteren.”
- bij het alfabetisch ordenen is er in grote trekken keuze tussen letter-voor-letter-ordening of woord-voor-woord-ordening.
Genealogie
In genealogische werken kiest men er vaak voor om de namen op een gestandaardiseerde vorm te sorteren, omdat namen voor de invoering van de burgerlijke stand vaak willekeurig geschreven werden. Personen met de namen Cleyn, Cleijn, Klein, staan dan bij elkaar alsof er Klein stond.
Uitgebreide tekenset
Ook voor letters met accenten, diakritische tekens of bijkomende letters geldt niet overal en in elk geval dezelfde norm.
In het Nederlands wordt het deelteken of trema genegeerd. Een ä wordt gesorteerd als a.
In het Duits duidt dit teken (Umlaut) op een klankverschil, dat vroeger werd aangegeven door er een kleine e bij te schrijven. Deze e kreeg later de vorm van een deelteken. Letters met Umlaut worden daarom op verschillende manieren gesorteerd:
DIN 5007-1 (voor het sorteren van woorden, bijvoorbeeld in een woordenboek)
- ä = a
- ö = o
- ü = u
- ß = ss (het ß-teken is gegroeid uit een dubbele s.)
DIN 5007-2 (speciale sortering voor namen, zoals bijvoorbeeld in telefoonboeken. Op deze manier staan Müller en Mueller samen.)
- ä = ae
- ö = oe
- ü = ue
- ß = ss
Oostenrijkse sortering (voor telefoonboeken)
- ä komt na a (en komt dus pas na az)
- ö komt na o
- ü komt na u
- ß komt na ss
- St. komt na Sankt
In het Nederlands worden de deeltekens gewoonlijk genegeerd. Dat betekent dat Schröder en Schroeder apart gesorteerd staan in plaats van samen. Een moeilijkheid is nog wanneer iemand bij zijn geboorte met ö geregistreerd werd, maar bijvoorbeeld verhuisde naar Amerika en bijgevolg de spelling met oe als officiële spelling koos.
Accenten
Ook de accenten worden in het Nederlands gewoonlijk genegeerd bij het sorteren.
- café, cafetaria
In het Frans bestaan heel wat woorden die er hetzelfde uitzien wanneer de accenten weggelaten worden. Wanneer woorden alfabetisch dezelfde rangorde hebben, worden ze in het Frans bijkomend gesorteerd op de accenten, in de volgorde e é è ê ë.
- pécher, pêcher
- élève, élevé
Het laatste accent in het woord beslist eerst over de plaats in de sortering. cote < côte < coté < côté.
Ligaturen
Speciale regels waren soms in gebruik voor ligaturen, letters die samen als één letter werden geschreven of in één loodvorm werden gegoten.
- De lettercombinatie IJ in Nederlandse woorden werd vroeger wel meer bij de Y gesorteerd, of soms apart na de Y. (In de volgorde Y, IJ, Z.)[2] Dat wierp dan weer de vraag op waar men namen zoals Dijon sorteert. De ’ij’ is in die plaatsnaam geen Nederlandse ’IJ’-klank of geen letter Y, maar een I en een J.
Vandaag wordt IJ meestal als aparte letters gesorteerd (volgorde II, IJ, IK). Een uitzondering zijn telefoonboeken: omdat de y bewaard is gebleven in vele familienamen waar de moderne spelling ij zou gebruiken, staat de ij in Nederlandse telefoonboeken bij de y gesorteerd. In Nederlandstalige telefoonboeken uit België staat de ij gesorteerd als een i en een j, dus tussen ii en ik.
- In het Frans wordt de Œ gesorteerd als OE, hoewel de Œ een heel andere functie vervult dan OE.
- In het Deens en het Noors staat de Æ na de Z, (gevolgd door Ø en Å). In het Nederlands zou de Æ gewoonlijk gesorteerd worden als AE.
- De Duitse ß ontstond als ligatuur voor een dubbele s en wordt in de regel ook zo gesorteerd.
Andere talen
Vele talen hebben bijkomende eigen regels voor het sorteren. Wanneer enkele woorden of termen uit die talen tussen Nederlandse woorden gesorteerd worden, is het niet de gewoonte om voor elk woord te sorteren volgens de taal waaruit dit woord komt.
- In het Esperanto worden medeklinkers met een circumflex (ĉ, ĝ, ĥ, ĵ, ŝ), en de ŭ (u met brevis), als aparte letters gesorteerd. Ze volgen elk na hun versie zonder accent.
- In het IJslands volgt de Ð na de D, en de Þ komt op het einde van het alfabet.
- In het Hongaars komt Ö na de O en Ü na de U. Lange klinkers worden met een accent geschreven: Á, É, Í, Ó, Ú, Ő, Ű. Deze worden bij hun korte tegenhangers A, E, I, O, U, Ö, Ü gesorteerd.
- In het Spaans gebruikt men de Ch als een aparte letter, die alfabetisch niet bij de C staat. De ñ volgt na de n.
Bronnen, noten en/of referenties |