Hoppa till innehållet

Wikipedia:Etiketter/Om

Från Wikipedia

Wikietiketter är både namnet på en samling mjukvaror och ett Wikiprojekt. I detta Wikiprojekt skapar vi uppsättningar med etiketterade data från händelser i wikin och mjukvaran ämnar att göra detta arbete lättare. Namnet kan på engelska (Wiki labels) tolkas både som ett substantiv

We work together on Wikipedia to produce wiki labels for important data.

eller som ett verb (på samma sätt som "Wiki loves...")

In order to get the data we need, wiki labels edit quality.

Mål och syfte[redigera | redigera wikitext]

Etikettlogon
Etikettlogon

Målet med detta projekt är att skapa klassificerade uppsättningar med data för ett ökande behov hos Wikipediagemenskapen. Klassificerade data har en rad med användningsområden, inklusive forskning (till exempel kvalitativ analys av nybörjarkvalitet[1] och interaktioner hos användare[2]) och utveckling av avancerade wikiverktyg (till exempel modellerna som används av en:User:ClueBot NG och en:WP:STiki). Generellt sett är det svårt att samla sådana här uppsättningar med data och det kräver en avsevärd investering av både tid och arbete av en grupp för att "handkoda" en tillräckligt stor uppsättning data.

Vi vill (1) identifiera möjligheter att skapa viktiga klassificerade uppsättningar med data, (2) fördela arbetet så brett som möjligt och (3) göra det enkelt och effektivt att "handkoda" stora uppsättningar data. Se vår lista med kampanjer för att se vad som är aktuellt. Om du vill hjälpa till, skriv upp dig på deltagarlistan. Om du har en idé på en uppsättning med data som du vill klassificera starta en diskussion

Hur kan jag hjälpa till?[redigera | redigera wikitext]

Det finns flera sätt som du kan hjälpa till på.

Klassificera (lägg till etiketter)
Projektet går ut på att lägga till etiketter till särskilda saker på Wikipedia. För de flesta kampanjer behöver ett stort antal observationer att klassificeras för att få ut något vettigt av ett dataset. Ett av målen med projektet är att så effektivt som möjligt fördela detta arbete. Om du är intresserad av att hjälpa till, lägg till ditt namn nedan.
Programmera
Fixa buggar, skapa nya funktioner och förbättra prestanda. Pull requests välkomnas! Se koden på Github.
Administration
Sätt igång kampanjer, ta hand om problem med systemet och hjälp nybörjare att komma igång med klassificering. Om du är intresserad av att syssla med städning åt Wikietiketter, kontakta EpochFail eller He7d3r.

Partnerprojekt[redigera | redigera wikitext]

Versionsvärdering som en service (Revision scoring as a service)[redigera | redigera wikitext]

Versionsvärderingslogon
Versionsvärderingslogon

Många av Wikipedias mest kraftfulla verktyg bygger på maskinklassificering av kvaliteten på redigeringar. I detta projekt vill vi skapa ett publikt åtkomligt API med maskinklassificerade värden för versioner. Vi tror att genom att tillhandahålla en sådan tjänst gör vi det mycket enklare att bygga nya kraftfulla verktyg och flytta befintliga verktyg till nya wikis. För att kunna bygga bra maskinklassificerare måste vi ha hög kvalitet på klassificerat data. Det är där Wikietiketter kommer in. Se WP:Etiketter/Redigeringskvalitet.

ORES logo
ORES logo

Det primära sättet som utvecklare av wikiverktyg kommer att få nytta av detta projekt är genom en restful web service och ett värderingssystem som kallas ORES (Objective revision evaluation service). ORES tillhandahler en web service som på begäran ger värden för versioner. Som exempel: http://ores.wmflabs.org/scores/enwiki?revids=34854258&models=reverted frågar efter värdet i "återställningsmodellen" för versionen #34854258 på engelska Wikipedia.

Det går nu att filtrera ändringar med hjälp av ORES. Se hur man gör det i denna instruktionsvideo.

  1. ^ Halfaker, A., Geiger, R. S., Morgan, J. T., & Riedl, J. (2012). The rise and decline of an open collaboration system: How Wikipedia’s reaction to popularity is causing its decline. American Behavioral Scientist, 0002764212469365. sammanfattning hela artikeln
  2. ^ m:Grants:IEG/Editor_Interaction_Data_Extraction_and_Visualization