Requirements and Design Considerations for an Open and General Architecture for Information Refinement Fredrik Olsson

Slides:



Advertisements
Liknande presentationer
Digitala portföljer Jonas Gustafsson ILU 15 december 2004
Advertisements

Innovativ användning av IKT i skolor i olika europeiska länder Ulf Fredriksson, Stockholms universitet Gunilla Jedeskog, Linköpings universitet 1.
Reveal Kurs HR och Volontärsamordning Medel This project has been funded with support from the European Commission. This publication reflects the views.
Strukturerad dokumentation och XML
Ulf P Andersson GMV
Serverkampanj för mellanmarknaden – genom partnerpresentation: Bild endast för presentatör: visa inte Talare: Partner Presentationens titel: Kraften att.
Att söka och förvalta kunskap
PETER Nicks Product Marketing Manager
Programmeringsteknik Föreläsning 13 Skolan för Datavetenskap och kommunikation.
Språkteknologisk forskning och utveckling (HT 2007)
Kurspresentation Virtuell produktion Bertil Gustafsson
The Ubiquitous Interactor Mobila tjänster med flera användargränssnitt.
Requirements and Design Considerations for an Open and General Architecture for Information Refinement Fredrik Olsson Jag kommer att.
Wearable Computers. Innehåll Introduktion Vad är Wearable computers? Varför Wearable computers? Användningsområden Utmaningar Energi Värmeutveckling Nätverk.
IT och kommunikationsvetenskap Teresa Cerratto Pargman, DSV
Objektorienterad tänkande
2007 Microsoft Office System - Klienten Pontus Haglund Mid Market Solutions Specialist Microsoft AB.
Eller formativt lärande…
Detection of similarity between documents Axel Bengtsson Ola Olsson
Dataföreningen i Sverige
Språkteknologiska metoder Språkteknologisk forskning och utveckling (HT 2006)
Introduktion till DITA
Att gå från magkänsla till faktabaserad utveckling Stöd för förskolor och skolor som vill ordna analysgrupp Metoden har utvecklats och prövats i Eu-projektet.
TEI Header Mats Dahlström Digitalisering av kulturarvet April 2007.
Valideringsprocessen
FL3: Techniques Interaktionsdesign i digitala medier (A.1) HT-2012, 7,5 hp Lärare: Daniel Nylén.
Design rationale för MDI Vad är Design rationale? Varför behövs det? Hur arbetar man konkret? Bidrag till MDI-forskning Att läsa: Kapitel 15 i Carroll.
Styrteknik: Grundläggande logiska funktioner D2:1
Exempelbaserade specifikationer med SpecFlow
Gränsöverskridande i flerspråkig kommunikation med datorer Robin Cooper, professor i datalingvistik Föreståndare, Nationella forskarskolan i språkteknologi.
Skriftlig individuell uppgift Interaktionsdesign i digitala medier (A.1) HT-2012, 7,5 hp Lärare: Daniel Nylén.
Daniel Nylén, Institutionen för Informatik Organisation 2 C.1 Systemdesign.
Systemdesign som process
Designstöd Daniel Fällman Institutionen för informatik Umeå universitet Design och utvärdering, 5 poäng.
MDI och användbarhet Måndagen den 27/3 Design och utvärdering, 5 poäng.
Läsbar prolog CM 8.1. allmäna principer correctness user-friendliness efficiency readability modifiability robustness documentation.
Helena Lindgren 1 MDI – fördjupningskurs (D – nivå) Kursens mål ge teoretisk fördjupning i ämnet människa-dator interaktion, ge kunskap om metoder.
Helena Lindgren 1 Projektspecifikation LÄS DEN NOGA FLER ÄN EN GÅNG.
Jonny Karlsson PROCESSPROGRAMMERING Föreläsning 8 ( )‏ Innehåll:  Introduktion till Java EE (Enterprise Edition)  Enterprise Java Beans.
System arbetssystem informationssystem
Hur lär man sig att arbeta? Donald Schön The Reflective Practitioner – how professionals think in action.
Arkitektrollen. Ansvar och uppgifter Architecture notebook Mycket intensivt elaboration – inception Mål: en stabil arkitektur i slutet på elaboration.
1 Mjukvaru-utveckling av interaktiva system God utveckling av interaktiva system kräver abstrakt funktionell beskrivning noggrann utvecklingsmetod Slutanvändare.
To practise speaking English for 3-4 minutes Genom undervisningen i ämnet engelska ska eleverna ges förutsättningar att utveckla sin förmåga att: formulera.
© Gunnar Wettergren1 IV1021 Project models Gunnar Wettergren
Formella metoder i MDI Behovet Vad menas med formell? Verktyg Exempel Att läsa: Kapitel 14 i kursboken.
Tillsynsuppgiften & Tillsynsrollen
PV7170 Föreläsning 1a Introduktion
1-1 Copyright © 2009 Pearson Education, Inc. Publishing as Pearson Addison-Wesley 1-1 Programmering 7.5 hp Programmering är... creativ, fascinerande, roligt,
Föreläsning om RUP RUP – Rational Unified Process
Helena Lindgren 1 MDI – fördjupningskurs (D – nivå) Kursens mål ge teoretisk fördjupning i ämnet människa-dator interaktion, ge kunskap om metoder.
Lab Contact 1  Lab Assistants:  Meng Liu, Group B  Sara Abbaspour, Group A
Anpassa fri programvara - Frihet ett, hur nyttjar man den? Copyright © 2006, 2007 Marcus Rejås Rejås Datakonsult Jag ger härmed rätten till alla att nyttja.
Information som social rättighet Mathias Klang. Idag Hur hamnade vi här? Vad är Open Access? Hur fungerar Creative Commons?
Prototyper Grupp 4 Fredrik Persson | Mahdi Bawaqneh | Maksim Nikitin | Sverre Brecheisen.
Produktarkitektur Viktor Jakobsson, Fredrik Petterson, Jenny Widmark.
Introduktion till SAML federation Varför använda SAML federation för elektronisk legitimering och underskrift Stefan Santesson Martin Lindström.
UD2014 The web and cognitive disabilities 18th of June 2014 Begripsam – ett projekt om kognitiv tillgänglighet.
Why you should consider hiring a real estate attorney!
Types of Business Consulting Services Cornerstoneorg.com.
GDPR - General Data Protection Regulation
Politisk kommunikation II
Designstöd Design och utvärdering, 5 poäng
Meeting singles had never been so easy before. The growing dating sites for singles have given a totally new approach to getting into relationships. ‘Singles.
Strategic Sustainable Development
My role model.
You Must Take Marriage Advice to Stop Divorce! Dontgetdivorced.com.
Vad betyder Social Kompetens
The “MiGreat Project”- n
Presentationens avskrift:

Requirements and Design Considerations for an Open and General Architecture for Information Refinement Fredrik Olsson

Innehåll 1. Introduktion. 2. Informationsförädling. 3. Några viktiga mjukvaruplattformar. 4. En fallstudie – SVENSK. 5. Allmänna observationer. 6. Kravspecifikation och design av en öppen arkitektur för informationsförädling. 7. Slutsatser.

Nyttan av generell och återanvändbar språkteknologimjukvara Undvika att uppfinna hjulet om och om igen. Förkorta vägen från idé till prototyp. Ett steg mot reproducerbara forsknings- resultat.

Några utmaningar Variationer mellan och inom språk. Kunskap om: Uppgiften. Användarna. Användarnas situation. Underhåll av språkliga resurser.

Mål och frågor (1/2) Q-1: Hur beskriva en mängd relaterade språkteknologiuppgifter som är liten nog att försöka göra generell mjukvara för, och som samtidigt är stor nog för att rättfärdiga det merarbete som konstruerandet av sådan mjukvara medför? Definiera en generell och öppen arkitektur för informationsförädling.

Mål och frågor (2/2) Q-2: Hur kan mängden relaterade uppgifter beskrivas i termer av krav som en tänkt användare kan ha? Q-3: Hur kan kravspecifikationen implementeras, dvs. hur ska en mjukvara som svarar mot kraven designas?

Informationsförädling (1/2) Med informationsförädling menas den arbetsprocess i vilken text hanteras i syfte att komma åt de delar av innehållet som är relevant sett från ett visst perspektiv.

Informationsförädling (2/2) – några tillämpningsområden Nyheter och mobila tjänster (SICS, DSV och room33 AB). Databrytning (SICS, eNiklas AB). Stöd för professionella informationssökare (SICS, Patent- och Registreringsverket). Proteinnamnsigenkänning (SICS, Virtual Genetics Laboratory AB).

Mjukvaruplattformar (1/8): TIPSTER DARPA, CIA, DoD, NIST, SPAWAR Mål: effektiv och billig dokumenthantering. Objektorienterad databasarkitektur: Dokument och samlingar av dokument. Annoteringar, spann och attribut. Specifikationen publikt tillgänglig. Ingen har gjort en fullständig implementation.

Mjukvaruplattformar (2/8): Eurotra EU-projekt: 12 länder, 18 institutioner, 150 forskare Mål 1: förindustriell prototyp av transferbaserad maskinöversättning för nio språk. Mål 2: förbättra forskningsklimatet och kompetensen i datorlingvistik i europa. Delar av arbetet finns tillgängligt.

Mjukvaruplattformar (3/8) : CLE SRI International, Cambridge University. Engelskt projekt (?). Mål: domänoberoende system för att omvandla engelska till formell representation. Inte publikt tillgänglig: ”You don’t give away a one million Pound program” (SRI:s forskningschef).

Mjukvaruplattformar (4/8): ALEP EU-projekt: IAI, Cap Gemini, SNI, SRI-CRC, Cray Systems, SEMA, BIM Mål: plattform för att minska tiden från prototyp till produkt. Möjligt att inkorporera existerande komponenter. Publikt tillgänglig.

Mjukvaruplattformar (5/8): Verbmobil Tyskt storprojekt. 31 partners, 168,6 miljoner D-mark, 900+ forskare Mål: tal till tal-översättningssystem: tyska, engelska och japanska. Resultatet finns inte publikt tillgängligt.

Mjukvaruplattformar (6/8): GATE GATE: University of Sheffield – Mål: teoriobunden kommunikations- och kontrollinfrastruktur för språkteknologikomponenter. Bygger på TIPSTER. Fritt tillgänglig.

Mjukvaruplattformar (7/8): DARPA Communicator DARPA, MITRE, AT&T Labs, MIT, IBM, NIST. Bygger på MIT’s Galaxy II. Mål 1: nästa generations multimodala gränssnitt till distribuerad information. Mål 2: en arkitektur för alla där det är lätt att anpassa och utvärdera moduler. Fritt tillgänglig.

Mjukvaruplattformar (8/8): ATLAS NIST, MITRE, LDC. Mål: generell arkitektur för att annotera lingvistisk data med tillhörande verktyg. Påminner om TIPSTER. Fritt tillgänglig: bjuder in alla att vara med.

En fallstudie – SVENSK (1/3) NUTEK, SICS Mål: generell verktygslåda för svenska bestående av återanvändningsbara komponenter. Bygger på GATE.

TextCat Tokeniser LexToken Splitter UCP SweCG 2 CLEBrillTagger ParserBox DSPDUP LP-Detect SweCG Indata Utdata

En fallstudie – SVENSK (3/3) Utmaningar: Politiska; dela med sig, licenser, dokumentation. Tekniska: integrering, APIer, buggar i svarta lådor, dokumentation. Lingvistiska: domänanpassning, avsaknad av verktyg för lingvistisk avlusning och underhåll.

Allmänna observationer (1/2) Hög tid att utvecklare kombinerar kunskap från språkteknologiområdet med traditionell mjukvaruutveckling. En arkitektur bör vara generell m.a.p. en klass av uppgifter, inte ett helt forskningsfält. Olika typer av användare kan ha olika krav.

Allmänna observationer (2/2) Håll arkitekturen öppen. Möjliggör användande av existerande och systemspecifika komponenter. Stöd underhåll av arkiktekturen.

Behov av en ny plattform - Kaba Fanns ingen passande plattform för informationsförädling. Full kontroll över koden: Funktionalitet. Distribution/öppenhet.

Kravspecifikation för informationsförädling (1/3) Användare: datorlingvist/programmerare. Kaba ett verktyg för utvecklare av informationsförädlingssystem. Tillåta integrering av existerande och specialgjorda komponenter. Bygga på öppna standarder. Favoriserar ingen speciell lingvistisk teori.

Kaba-baserat system Information Användare Kaba-baserat system Kaba-baserat system Information AnvändareMjukvara

Kravspecifikation (3/3) - användarkrav 1. Utveckla informationsförädlingssystem. 2. Utvärdera system. 3. Flytta system till ny informationsdomän eller till nytt språk. 4. Dokumentera system. 5. Underhålla system. 6. Skapa lektioner. 7. Hantera data och program.

Design av en öppen arkitektur (1/4) Hantering av data: Metadata för komponenter (UC 7.1). In- och utdata (UC 7.3, 7.4). Intern representation av annoterad text (UC 7.6). Databeständighet (UC 7.5).

Design av en öppen arkitektur (2/4) Interaktion med andra: Kaba-baserat system används av annan mjukvara (UC 1.1.1). Kaba-baserat system använder externa komponenter (UC 7.7.3). Kaba-baserat system interagerar med människor (UC 1.2.1, 1.2.2, 1.2.3). Distribuerad processning (UC 1.1.3, 7.7.1). Dokumentation och lektioner (UC 1.1.4, 4, 6, 7.2).

Design av en öppen arkitektur (3/4) Skapa interna (systemspecifika) komponenter (UC 7.8.1). Använda interna komponenter (UC 7.8.3). Underhåll av system: Underhåll av externa komponenter (UC 1.1.2, 7.7.2). Underhåll av interna komponenter (UC 7.8.2). Underhåll av hela system (UC 5).

Design av en öppen arkitektur (4/4) Stöd för att flytta Kaba-baserade system mellan olika informationsdomäner (UC 3). Stöd för utvärdering av system (UC 2).

Slutsatser Syftet med generella verktyg är gott, men genomförandet är problematiskt och inte alltid berättigat. Användbara generella verktyg kräver begränsningar! Informationsförädling bra begränsning. Kravspecifikation och designförslag kan synliggöra nya forskningsfrågor.

Nya forskningsfrågor (1/3) När en hypotes om informationsförädling har implementerats i ett system, är det möjligt att använda samma system, eller delar av det, för att testa en annan hypotes? När är det bättre att bygga ett helt nytt system än att återanvända ett existerande?

Nya forskningsfrågor (2/3) Vilka metoder är användbara för att samla och annotera data i syfte att träna och utvärdera komponenter för informationsförädling? Vilka maskininlärningsmetoder är lämpliga för vilka informationsförädlingsuppgifter?

Nya forskningsfrågor (3/3) Givet att ett informationsförädlingssystem ska konstrueras och att det är tänkt att användas och kanske t.o.m. definieras av användare som inte är experter; vilka metoder finns det för att fånga slutanvändarnas informationsbehov?

Exempel på ett Use Case Use Case 7.5: Manage data persistence Goal: To manage data that is persistent across user sessions. Scope: System. Level: User goal. Description: The system will produce intermediate results, e.g., part-of-speech tagged text or documents in which named entities have been marked. Data persistence is necessary for two reasons: sharing intermediate results and error recovery, both of which boil down to not having to redo work already done. Essentially this means that the system could be shut down in an (un)controlled fashion, yet still keep the results of the processing made so far. The implications of data persistence also indicate that a user may work with the same source of information during several sessions while having access to the results from the previous ones.