Titta

UR Samtiden - DigiGiella18 - Samiska språk och digital teknik

UR Samtiden - DigiGiella18 - Samiska språk och digital teknik

Om UR Samtiden - DigiGiella18 - Samiska språk och digital teknik

Arbetet med att revitalisera de samiska språken går framåt med hjälp av nya digitala verktyg, nätverkande och samarbetsprojekt. En serie föreläsningar inspelade den 7 februari 2018 på Mittuniversitetet i Östersund under festivalveckan Staare 2018. Arrangörer: Samiskt språkcentrum, Umeå universitet, Umeå kommun och SSR - Svenska samernas riksförbund.

Till första programmet

UR Samtiden - DigiGiella18 - Samiska språk och digital teknik : Språkteknologi i vardagenDela
 1. Man skickar in texter
  och ut kommer grammatikövningar.

 2. Välkomna till vår föreläsning
  om samisk språkteknologi i vardagen-

 3. -och Divvuns och Giellateknos verktyg.

 4. Mitt namn är Elena Paulsen.
  Jag jobbar som lulesamisk lingvist.

 5. Børre Gaup. Jag är programmerare
  och alltiallo i Divvun-projektet.

 6. Vi jobbar med samisk språkteknologi,
  med målet att kunna använda samiska-

 7. -lika naturligt som majoritetsspråken.

 8. Vi vill ha samma verktyg tillgängliga
  som finns för majoritetsspråken-

 9. -och erbjuder olika verktyg
  som ett led i att uppnå vårt mål.

 10. Samiska är
  väldigt annorlunda än språk som-

 11. -norska, svenska, engelska och tyska.
  Det kan vi se på det här exemplet.

 12. Det engelska verbet "att gå"
  har fyra böjningsformer.

 13. Med en ändelse
  får man en färdig verbform.

 14. På samiska har man
  många fler olika sätt att böja ord på.

 15. På lulesamiska t.ex.
  har samma verb 56 böjningsformer.

 16. Dessutom har vi avledningar,
  t.ex. för "börja gå" och "gå fort"-

 17. -vilka i sin tur har fem, sex böjningar.

 18. Engelska, norska, svenska och tyska
  har stora textsamlingar-

 19. -och enkel morfologi, och kan basera
  verktyg som t.ex. stavningskontroll-

 20. -på statistisk analys.

 21. Samiska språk har små textsamlingar-

 22. -och komplex morfologi, som ni ser.

 23. Textsamlingarna är väldigt små-

 24. -och saknar många böjningsformer,
  vilket gör att vi inte kan basera-

 25. -våra verktyg på statistik
  på samma sätt.

 26. Så det vi måste göra
  är att lära datorn samiska.

 27. Det gör vi på två olika nivåer -
  ordnivå och meningsnivå.

 28. Vår språkmodell både förstår böjda ord
  och kan böja dem själv.

 29. Här t.ex. ska vi böja-

 30. -det sydsamiska ordet gåetie
  till illativformen "till huset".

 31. Då måste vi först lokalisera
  ordstammen: gået.

 32. Sen lägger man till en illativändelse:
  gåetan, som aktiverar omljudsregeln-

 33. -så att "åe" övergår till "åa",
  och man får illativformen gåetan.

 34. Med det här
  kan man också börja bakifrån-

 35. -och hitta grundformen
  av ett ord som redan är böjt.

 36. Som sagt
  så har vi regler även på meningsnivå.

 37. En avancerad användning
  är maskinöversättning-

 38. -från nordsamiska till bokmål.
  Här har vi två exempel.

 39. Först analyserar vi
  den samiska meningen.

 40. Vi har regler som styr hur vi överför-

 41. -den samiska
  meningsbyggnaden till norska.

 42. Vi har motsvarande regler för norska:
  vi böjer orden och får en färdig mening.

 43. Här har vi två exempel,
  där det första ordet står i lokativ.

 44. Meningen ser likadan ut
  när man inte kan samiska.

 45. Den översätts till: "jag har en son"-

 46. -respektive:
  "på gårdsplanen är det en pojke".

 47. Skälet till att vi
  kan översätta det så olika-

 48. -är att vi först har analyserat på
  ordnivå och sen gjort meningsanalys.

 49. Vi får veta att vi har ett personligt
  pronomen som står i lokativ.

 50. Det har ordet leat efter sig.
  Det översätts till norska på två sätt:

 51. "Vädret" eller "att ha". När ett
  personligt pronomen står i lokativ-

 52. -översätts verbet oftast till "att ha".

 53. Då får vi: "jag har en son". Eftersom
  det är fråga om en ägandeform-

 54. -så översätter vi det sista ledet
  till obestämd form.

 55. I andra exemplet står ett substantiv i
  lokativ. Då vet vi att det är en plats.

 56. Därför kan vi säga: "på gårdsplanen".

 57. Här översätts leat med "att vara",
  vilket ger oss "är".

 58. Och baernie blir "är det", vilket ger
  "en pojke" i det här exemplet.

 59. Så fungerar
  våra mest avancerade regler-

 60. -på meningsbyggnadsnivå.

 61. Medan vi
  utvecklade de här verktygen...

 62. Vi började med nordsamiska
  och reglerna på ordnivå-

 63. -och därefter på meningsnivå.

 64. Det var en hel del tekniska utmaningar
  som vi måste lösa för nordsamiskan.

 65. Vi utvecklade därför ett gränssnitt
  som fungerar för nordsamiska.

 66. Alltså, vi har lagt in de språkliga
  resurserna i det här gränssnittet-

 67. -och löst de tekniska problemen, d.v.s.
  de som inte har med språk att göra.

 68. För sydsamiska och lulesamiska
  var det "bara" att lägga in ord-

 69. -och de regler som behövs
  för att få färdiga verktyg.

 70. Som ni ser har vi utvecklat
  stavkontroll, maskinöversättning-

 71. -och syntetiskt tal, d.v.s. att datorn
  kan läsa upp samisk text.

 72. Vi har utvecklat undervisningsprogram-

 73. -och intelligenta ordböcker,
  d.v.s. ordböcker som förstår böjda ord.

 74. Allt det här
  är fritt tillgänglig programvara.

 75. Det kan användas fritt,
  men de som använder det-

 76. -och gör förbättringar, måste
  dela med sig av sina förbättringar.

 77. Det har lett till ökat samarbete,
  inte bara inom de samiska språken...

 78. Ett av de samiska språkmiljöerna
  har själva tagit kontakt-

 79. -med universitetet i Tromsø
  och velat ingå i detta.

 80. De har jobbat mycket själva med att
  lägga in sitt språk, och de har fått...

 81. Man håller på att utveckla maskin-
  översättning från finska till samiska-

 82. -och från nordsamiska
  till enaresamiska, och vice versa.

 83. Vi samarbetar även med
  en del minoritetsspråk på rysk sida.

 84. Det började som ett ordboksprojekt
  som en kille i Helsingfors hade...

 85. ...planerat.
  Han pratade med en person hos oss.

 86. De kom fram till att det vore perfekt
  för Ryssland att samarbeta med oss.

 87. De la in sina ordböcker i vårt program
  och fick ordböcker.

 88. De la in grammatik, precis som vi
  har gjort med de samiska språken-

 89. -och fick tillgång
  till samma verktyg som samiskan.

 90. Och vårt samarbete berikar oss.
  Det är inte bara merarbete-

 91. -utan programvaran blir allt bättre
  och mer anpassad för fler språk.

 92. Vi har även samarbetat med
  minoritetsbefolkningen i Kanada.

 93. University of Alberta har nu stav-
  kontroller för plains cree och haida.

 94. De har även intelligenta ordböcker,
  där man förstår ordformer.

 95. Som Elena nämnde, så är många
  av språken som vi pratar om här-

 96. -inte så väl lämpade
  för statistisk analys.

 97. Vi har inte markerat grönländska här-

 98. -men deras stavkontroll från 90-talet
  baserade sig på statistisk analys.

 99. Den identifierade 25 % av alla kända
  ord, men med vår teknik har de-

 100. -kommit upp i 90 %, vilket innebär
  en användbar stavkontroll.

 101. Det är programvara och samarbete
  som gör avancerade verktyg möjliga.

 102. Men hur ska vi kunna skriva
  på samiska på ett enkelt sätt?

 103. Nordsamiskt tangentbord
  finns sen tidigt 2000-tal-

 104. -men nordsamiskt tangentbord funger-
  ade inte för enare- och skoltsamiska.

 105. Det var komplicerat att skriva
  sydsamiska och lulesamiska med det.

 106. Sen kom mobilen, och då
  behövde vi ett tangentbord till den.

 107. För att enklare kunna skriva på alla
  språk, så har vi utvecklat tangentbord.

 108. Vi utvecklade främst
  tangentbord till mobilen-

 109. -men det gjorde det lätt att fortsätta
  utveckla det till andra plattformar.

 110. Det finns nu för alla samiska språk.

 111. Vi har gjort det enkelt. När man skriver
  sydsamiska trycker man på en tangent-

 112. -för mörkt i-ljud
  och när man vill ha ett vanligt ö.

 113. På lulesamiska fick man på en vanlig
  dator använda tre tangenter för långt a.

 114. Ibland får vi bara in två bokstäver-

 115. -men det gör ändå att man enkelt
  kan skriva på sitt eget modersmål.

 116. Här har vi en översikt
  över de verktyg som vi har tillgängliga.

 117. I Divvun-programmet
  har vi stavkontroll.

 118. Vi har tangentbord och korpus, med
  en hemsida för avancerade sökningar.

 119. Vi har ordböcker, där Giellatekno
  står bakom gränssnittet.

 120. Ett verktyg för grammatik och vissa
  språkpar, och ytterligare ett annat-

 121. -med tillgång till
  alla språkpar på samma plats.

 122. På webbsidan TermWiki kan man hitta
  gemensam samisk terminologi.

 123. Vi har undervisningsprogram,
  t.ex. Gielese.

 124. Det programmet
  har vi inte på lulesamiska.

 125. Tack vare initiativ från sydsamisk sida
  har vi fått programmet på sydsamiska.

 126. Därför har det kommit på sydsamiska.
  Och så har vi Grammatik på nätet.

 127. Det vi bara har
  på nordsamiska är syntetiskt tal.

 128. Man kan få textdokument upplästa
  på samiska, så att man kan höra-

 129. -om man har skrivit fel nånstans.
  Och vi har maskinöversättning.

 130. Vi ska demonstrera några av
  verktygen. Stavkontrollen kan man-

 131. -installera på sin dator,
  eller använda online på nätet.

 132. Det är väldigt behändigt
  att kunna använda webbsidan.

 133. Där får man upp skrivfel, och förslag
  på hur det skulle kunna skrivas.

 134. Och det ligger alltså
  sex olika samiska språk här.

 135. Vi har ordböcker
  med inbyggd grammatik.

 136. Här är språkparen redan valda.

 137. Som vi ser här
  har vi från samiska till bokmål.

 138. Jag letar efter ordet vissui-

 139. -som är illativformen för viessu, hus.

 140. När jag trycker på "sök",
  säger den att det är en böjd form-

 141. -av både substantivet viessu
  och av verbet viessat.

 142. Om vi trycker vidare på ordet viessat...

 143. ...så får vi upp... Om det finns
  mer information, så får vi det här.

 144. Vi har de vanligaste böjningsformerna
  i presens och preteritum-

 145. -plus negationsformerna också.

 146. För substantiv böjs orden i alla kasus,
  och i ental och flertal.

 147. Vid behov av fler böjningsformer-

 148. -kan man gå till
  en specialsida för böjning av ord.

 149. Där ser vi att vi får ännu fler
  böjda former av det här ordet.

 150. Allt det här får vi upp...

 151. När vi söker i datorn, skickas det
  till vår analysator, som sen svarar.

 152. Varje gång vi gör en sökning,
  så skapas de här böjningsformerna.

 153. Och så har vi ett användargränssnitt-

 154. -för flera språk.

 155. Där har man
  tillgång till alla språken samtidigt.

 156. Om vi letar efter viess...

 157. ...så får vi förslag
  på många olika språk.

 158. Till exempel är det första ordet
  från enaresamiska till nordsamiska-

 159. -och från nordsamiska till finska.

 160. Längre ner hittar vi ordet viesso, som
  på lulesamiska betyder flervåningshus.

 161. Vi ser vilka ordböcker som använts,
  t.ex. TermWiki-

 162. -och Sametingets ordbank. Längre upp
  såg vi de olika ordböckerna.

 163. Vi kan, både i den här
  och i den andra ordboken-

 164. -slå upp ord i vårt korpusgränssnitt.

 165. Man kan alltså söka
  i våra textsamlingar-

 166. -och se hur ord
  används i olika sammanhang.

 167. Vi har även alla ord i böjd form.

 168. Vi letar efter alla ord som...eller
  alla böjda former av ett visst ord.

 169. Vi har dessutom... Förutom
  att kunna visa ett ord i olika kontext-

 170. -så har vi även meningsanalys.
  Och den är redan inlagd.

 171. Dessutom har vi maskinöversättning.

 172. Från nordsamiska till bokmål.

 173. Det har vi offentliggjort nu.

 174. Antingen skriver man in text
  eller en webbadress-

 175. -varvid webbsidan översätts direkt.

 176. Här ser vi en maskinöversatt version av
  Ávvirs nordsamiska förstasida.

 177. Som ni ser, blir de
  samiska texterna översatta till bokmål.

 178. En del översättningar är bra,
  andra mindre bra, men de är begripliga.

 179. Skälet till att det blir
  lite skakigt ibland är att-

 180. -samisk och norsk meningsbyggnad
  är väldigt olika. Det är ett problem.

 181. Översättning från nordsamiska till
  de andra samiska språken är på gång-

 182. -och vi testar betaversioner internt.

 183. Vi översätter även tillbaka från
  de samiska språken till nordsamiska.

 184. Det är samma språkfamilj, så vi
  hoppas att översättningarna blir så bra-

 185. -att översättare bara behöver
  korrekturläsa maskinöversatt text.

 186. Det kommer att gå fortare
  att översätta t.ex. läromedel, och...

 187. ...tidningsartiklar.

 188. Det var vår demonstration.
  Vad väntar då i framtiden?

 189. Vi har bland annat ett program
  som heter Konteaksta på gång.

 190. Det är ett program
  för grammatikövningar.

 191. Man skickar in text i programmet,
  och ut kommer grammatikövningar.

 192. Här är det nån
  som vill titta på substantiv i en text.

 193. "Kan jag få tomma luckor
  för eleven att fylla i?"

 194. Eleven har fyllt i två substantiv rätt,
  här markerat med grönt.

 195. När eleven fyller i nåt som inte passar
  in i kontexten, markeras det med rött.

 196. Det står ett frågetecken bredvid,
  som gör att eleven kan få hjälp.

 197. Det fungerar i Word, med webbsidor
  och vid maskinöversättning.

 198. Elever kan göra uppgifter baserade på
  aktuella och intressanta texter.

 199. Nåt annat som snart kommer
  är grammatikkontroll.

 200. Den jobbar på två nivåer.
  Den hittar ord som är fel...

 201. ...och grammatikfel.
  Man får förslag som i det här exemplet.

 202. Om ett ord skrivs i nominativ när det
  ska vara genitiv, får man förslag på-

 203. -vad det egentligen ska vara.

 204. Man får hjälp
  att skriva korrekt samisk syntax.

 205. Det här har vi kunnat utveckla
  tack vare en kollega som doktorerar.

 206. Hennes forskning är nödvändig
  för den här grammatikkontrollen.

 207. Man kan också utveckla grammatik-
  kontroller till andra samiska språk.

 208. Då fyller man "bara" i böjningsregler
  och meningsbyggnadsregler-

 209. -för t.ex. sydsamiska och lulesamiska.

 210. Det var
  en kort beskrivning av våra verktyg.

 211. Översättning: Louise Hjorth
  www.btistudios.com

Hjälp

Stäng

Skapa klipp

Klippets starttid

Ange tiden som sekunder, mm:ss eller hh:mm:ss.

Klippets sluttid

Ange tiden som sekunder, mm:ss eller hh:mm:ss.Sluttiden behöver vara efter starttiden.

Bädda in ditt klipp:

Bädda in programmet

Du som arbetar som lärare får bädda in program från UR om programmet ska användas för utbildning. Godkänn användarvillkoren för att fortsätta din inbäddning.

tillbaka

Bädda in programmet

tillbaka

Språkteknologi i vardagen

Produktionsår:
Längd:
Tillgängligt till:

Børre Gaup och Elena Junie Paulsen arbetar på Institutet för språk och kultur i Tromsø. Båda är en del av projektet Divvun. Här demonstrerar de en rad nya digitala verktyg som erbjuder bland annat grammatikkontroll, substantiv- och verbböjning samt stavningskontroll för sex olika samiska språk. Inspelat den 7 februari 2018 på Mittuniversitetet i Östersund under festivalveckan Staare 2018. Arrangörer: Samiskt språkcentrum, Umeå universitet, Umeå kommun och SSR - Svenska samernas riksförbund.

Ämnen:
Modersmål och minoritetsspråk > Samiska
Ämnesord:
Samiska språk, Språkvetenskap
Utbildningsnivå:
Allmänbildande

Alla program i UR Samtiden - DigiGiella18 - Samiska språk och digital teknik

Spelbarhet:
UR Skola
Längd:
TittaUR Samtiden - DigiGiella18 - Samiska språk och digital teknik

Så främjas de samiska språken

Hur ser situationen för de samiska språken ut idag och vad gör Sametinget för att främja dem? Lars Miguel Utsi, ordförande i Sametingets språknämnd, inledningstalar på nordsamiska vid språkkonferensen #DigiGiella18. Inspelat den 7 februari 2018 på Mittuniversitetet i Östersund under festivalveckan Staare 2018. Arrangörer: Samiskt språkcentrum, Umeå universitet, Umeå kommun och SSR - Svenska samernas riksförbund.

Produktionsår:
2018
Utbildningsnivå:
Allmänbildande
Beskrivning
Spelbarhet:
UR Skola
Längd:
TittaUR Samtiden - DigiGiella18 - Samiska språk och digital teknik

Sametingets ordboksapp

Nu finns Sametingets ordböcker som app för mobiler och surfplattor. Appen är gratis och när den väl är nedladdad funkar den också utan telefontäckning och internetuppkoppling. Än så länge finns den på sydsamiska och lulesamiska. Anders Östergren från Samiskt språkcentrum visar hur appen fungerar och berättar om arbetet med att revitalisera de samiska språken. Inspelat den 7 februari 2018 på Mittuniversitetet i Östersund under festivalveckan Staare 2018. Arrangörer: Samiskt språkcentrum, Umeå universitet, Umeå kommun och SSR - Svenska samernas riksförbund.

Produktionsår:
2018
Utbildningsnivå:
Allmänbildande
Beskrivning
Spelbarhet:
UR Skola
Längd:
TittaUR Samtiden - DigiGiella18 - Samiska språk och digital teknik

Samiska ur ett arvspråksperspektiv

Hur håller man ett ickedominant språk vitalt? Mikael Vinka, professor i samiska, reder ut begreppen kring minoritetsspråk och deras villkor. Han beskriver också hur små barn lär sig språk och hur viktigt det är att barn exponeras mycket inför det språk man vill föra vidare. Inspelat den 7 februari 2018 på Mittuniversitetet i Östersund under festivalveckan Staare 2018. Arrangörer: Samiskt språkcentrum, Umeå universitet, Umeå kommun och SSR - Svenska samernas riksförbund.

Produktionsår:
2018
Utbildningsnivå:
Allmänbildande
Beskrivning
Spelbarhet:
UR Skola
Längd:
TittaUR Samtiden - DigiGiella18 - Samiska språk och digital teknik

Samiskt språknav

Umeå kommun har förändrat sitt sätt att arbeta med samiska som modersmål i både förskola och skola. Bland annat erbjuder man fler undervisningstimmar och nya möjligheter för de elever som läser samiska att träffas och använda språket. Marie Karling, chef för Samiskt språknav, berättar. Inspelat den 7 februari 2018 på Mittuniversitetet i Östersund under festivalveckan Staare 2018. Arrangörer: Samiskt språkcentrum, Umeå universitet, Umeå kommun och SSR - Svenska samernas riksförbund.

Produktionsår:
2018
Utbildningsnivå:
Allmänbildande
Beskrivning
Spelbarhet:
UR Skola
Längd:
TittaUR Samtiden - DigiGiella18 - Samiska språk och digital teknik

Giellagáldu - ett samiskt språksamarbete

Språkgränserna inom Sápmi finns egentligen inte, exempelvis talas det nordsamiska på många ställen. Därför är det nordiska språksamarbetet Giellagáldu extra viktigt, menar Marko Marjomaa som leder projektet. Inspelat den 7 februari 2018 på Mittuniversitetet i Östersund under festivalveckan Staare 2018. Arrangörer: Samiskt språkcentrum, Umeå universitet, Umeå kommun och SSR - Svenska samernas riksförbund.

Produktionsår:
2018
Utbildningsnivå:
Allmänbildande
Beskrivning
Spelbarhet:
UR Skola
Längd:
TittaUR Samtiden - DigiGiella18 - Samiska språk och digital teknik

Språkteknologi i vardagen

Børre Gaup och Elena Junie Paulsen arbetar på Institutet för språk och kultur i Tromsø. Båda är en del av projektet Divvun. Här demonstrerar de en rad nya digitala verktyg som erbjuder bland annat grammatikkontroll, substantiv- och verbböjning samt stavningskontroll för sex olika samiska språk. Inspelat den 7 februari 2018 på Mittuniversitetet i Östersund under festivalveckan Staare 2018. Arrangörer: Samiskt språkcentrum, Umeå universitet, Umeå kommun och SSR - Svenska samernas riksförbund.

Produktionsår:
2018
Utbildningsnivå:
Allmänbildande
Beskrivning
Visa fler

Mer allmänbildande & modersmål och minoritetsspråk

Spelbarhet:
UR Skola
Längd
Titta Lagom mycket finsk

Skogsfinnarna

Skogsfinländarna var folk från östra Finland som flyttade till Sverige på 1500- och 1600-talen för att idka svedjebruk. De var ett mytomspunnet folk som bevarade sina seder, sin folktro och sitt språk i flera hundra år. Visste du att det talades finska i Värmland ända in på 1950-talet? Att det fanns skogsfinska besvärjelser för allt från att förbättra sviktande potens till att bota kossans kolik?

Spelbarhet:
UR Skola
Längd
Titta UR Samtiden - Språkseminarium i finska 2019

Nyord i finskan

Gubbyoga, jäktkultur och mobilmedgivande är några av de nyord som tillkom finskan under 2018. Matti Räsänen, språkvårdare vid Institutet för de inhemska språken, berättar om teman och trender som påverkar ordens väg till finskan. Inspelat den 28 mars 2019 på Finlandsinstitutet i Stockholm. Arrangör: Språkrådet.