Kursplan

Översikt över Python paket relaterade till NLP

 

Introduktion till NLP (exempel i Python såklart)

    Enkel textmanipulation Söka texträkning Words Dela upp texter i Words lexikalisk spridning
Bearbeta komplexa strukturer Representera text i listor
  • Indexering av listor
  • Samlokaliseringar
  • Bigrams
  • Frekvensfördelningar
  • Villkor med Words
  • Jämföra Words (startswith, endswith, islower, isalpha, etc...)
  • Naturlig språkförståelse Word Sinnesdisambiguation
  • Pronomen upplösning
  • Maskinöversättningar (statistiska, regelbaserade, bokstavliga, etc...)
  • Övningar
  • NLP i Python i exempel
  • Tillgång till text Corpora och lexikaliska resurser Vanliga källor för korpora Villkorliga frekvensfördelningar Räkna Words efter genre Skapa egen korpus Uttalande ordbok Skolåda och verktygslåda Lexikon Sinnen och synonymer Hierarkier Lexiska relationer: Meronymer, holonymer Semantisk likhet
  • Bearbetar råtextutskrift
  • Struncating

      Extrahera delar av snöret
    Accessing av enskilda karaktärer
  • Searchersätta, ersätta, dela, sammanfoga, indexera, etc...
  • Använda reguljära uttryck
  • Upptäcka ordmönster
  • Stemming
  • Tokenisering
  • Normalisering av text
  • Word Segmentering (särskilt på kinesiska)
  • Kategorisering och taggning Words Taggade Corpora
  • Taggade tokens
  • Uppsättning av talord
  • Python Ordböcker
  • Words till Egenskaper är kartläggning
  • Automatisk märkning
  • Att bestämma kategorin för en Word (morfologisk, syntaktisk, semantisk)
  • Textklassificering (Machine Learning) Övervakad klassificering
  • Meningssegmentering
  • Korsvalidering
  • Beslutsträd
  • Extrahera information från textchunking
  • Chinking
  • Taggar vs träd
  • Analysera meningsstruktur Kontext gratis grammatik
  • Parsers
  • Bygga funktionsbaserade grammatiker Grammatiska funktioner
  • Bearbetningsfunktionsstrukturer
  • Analysera innebörden av meningar Semantik och logik
  • Propositionell logik
  • Första ordningens logik
  • Diskurssemantik
  • Hantera språkliga datadataformat (lexikon vs text)
  • Metadata
  • Krav

    Grundläggande kunskap om Python

     28 timmar

    Antal deltagare



    Price per participant

    Vittnesmål (1)

    Relaterade Kategorier