Kako instalirati NLTK?

Sljedeći članak Instalacija NLTK nudi pregled instalacije NLTK-a. NLTK je skup knjižnica za obradu prirodnog jezika. To je platforma za izgradnju Python programa za obradu prirodnog jezika. NLTK je napisan na programskom jeziku Python-a. Razvili su ga Steven Bird i Edward Loper. Podržava istraživanje i podučavanje u NLP ili usko povezanim područjima, uključujući kognitivne znanosti, empirijsko jezikoslovlje, pronalaženje informacija, umjetnu inteligenciju i strojno učenje. NLTK pruža jednostavno sučelje.

NLTK (Priručnik za prirodni jezik)

  • Obrada prirodnog jezika (NLP) dio je umjetne inteligencije koja obrađuje jezik koji govore ljudi. Na taj način pomaže ljudima da komuniciraju s računalima čak i ako nemaju znanje o tome kako ih koristiti. Koristeći NLP, ljudi samo trebaju diktirati naredbu računalima. Snagom strojnog učenja obrada prirodnog jezika postaje popularna i lakša za implementaciju. U osnovi je tehnika interakcije s ljudima i izvršavanja akcija na glasovnim naredbama.
  • To omogućuje uređajima da ih koristi čak i novak koji nema znanje o tehnologiji. Ali provedba prirodne obrade jezika nije laka, jer jezik kojim ljudi govore nema određenu strukturu. To je dvosmisleno i ovisi o kontekstim riječima koje mogu imati različito značenje.
  • NLTK ima više od 50 korporativnih i leksičkih izvora kao što su WordNet, Corpus Report Report, Penn Treebank Corpus itd. Također dolazi s vodičem koji objašnjava koncepte jezične obrade pomoću alata i programskih osnova Pythona, što ljudima olakšava posao. koji nemaju duboko znanje o programiranju. Ima širok spektar paketa što ga čini jednim od moćnih alata za NLP. Tokenizacija, lematizacija, skraćivanje, razvrstavanje, broj znakova, interpunkcije, broj riječi su neki od ovih paketa.

Instalirajte NLTK za Windows

Ispod su upute za instaliranje NLTK-a u sustav Windows. Te se temelje na pretpostavci da Python nije instaliran u sustavu. NLTK zahtijeva Python verzije 2.7, 3.5 i novije verzije.

Korak 1: S najnovije verzije preuzmite najnoviju verziju Pythona za Windows

https://www.python.org/downloads/

2. korak: Kliknite na preuzeti .exe da biste ga pokrenuli.

Korak 3: Odaberite prilagođavanje instalacije.

Korak 4: Provjerite sve značajke, posebno "pip", jer pomaže instalirati NLTK i kliknite na Next.

Korak 5: Na sljedećem zaslonu odaberite napredne opcije, odaberite put i kliknite na instalaciju.

Korak 6: Jednom kada je instalacija uspješna blizu prozora.

Korak 7: Kopirajte put mape Skripti da biste instalirali NLTK u istu mapu.

NLTK se može lako instalirati pomoću instalacijskog programa „pip”. Također moramo instalirati i "numpy".

Korak 8: Da biste instalirali NLTK, otvorite naredbeni redak i upišite ispod naredbe.

Provjerite je li instalacija uspješna.

Nakon uspješne instalacije sada je došlo vrijeme za korištenje NLTK-a za obradu prirodnog jezika.

Korak 9: Otvorite Python Shell i utipkajte ispod naredbe.

Ako se uvozi bez pogreške, to znači da je NLTK pravilno instaliran.

Instalirajte NLTK za Mac / Linux

Za razliku od Windowsa, Linux sustavi dolaze s instaliranim Python-om. Za instalaciju NLTK-a u Linux / Mac koristi se instalacijski program Python's Pip. Za instaliranje pip-a ili ažuriranje upišite ispod naredbe u naredbeni redak.

Za instaliranje pythona u Linuxu koristite naredne naredbe.

1. korak: Za ažuriranje indeksa paketa koristite naredbu ispod.

Korak 2: Da biste instalirali Python u Linux sustav, upotrijebite dolje.

Korak 3: Unesite naredbu za instaliranje "pip" za Python 3.

Korak 4: Nakon što je program "Pip" uspješno instaliran, za instalaciju NLTK-a koristite sljedeće naredbe.

NLTK Skup podataka

NLTK ima mnogo skupova podataka dostupnih za obradu prirodnog jezika, na primjer, WordNet, WikiCorpus, Gutenberg, Mišljenje leksikona, Tweebank itd. Ti se skupovi podataka nazivaju korporacije. U osnovi, NLTK baza podataka sadrži skup datoteka ili dokumenata. Svaka datoteka / dokument sadrži zbirku riječi, slova ili teksta na jednom jeziku. Dakle, korpus su uglavnom knjižnice za razumijevanje / učenje jezika. Ima gramatička pravila i strukturu jezika.

Nakon uspješne instalacije NLTK-a, možete ga uvesti i također preuzeti njegovu korpusu sa sljedećom naredbom.

NLTK downloader otvara prozor za preuzimanje skupa podataka. Veličina skupa podataka velika je, pa će trebati vremena. Da biste provjerili jesu li skupovi podataka pravilno instalirani, pokušajte uvesti skup podataka i upotrijebiti ga.

Obrada NLTK-a

Postoji 5 glavnih procesa obrade prirodnog jezika. Ovo su koraci koji se odnose na obradu bilo kojeg teksta.

  1. EOS Detection : Kraj otkrivanja govora rastavlja tekst u zbirku smislenih rečenica. Dijeli tekst dijeli na dijelove koji imaju neko značenje.
  2. Tokenizacija : Ovaj korak dijeli rečenice u tokene. Tokeni ne sadrže samo riječi, nego uključuju i bjeline, prijelome rečenica.
  3. Označavanje POS-a : POS znači pat-of-govor. Ovdje su informacije dodijeljene tokenu. Ovaj podatak sugerira o kojoj je vrsti govora kao naprezanje, glagol, pridjev, imenica itd.
  4. Chunking : Chunking znači prikupljanje teksta na temelju oznaka.
  5. Ekstrakcija: Ekstrakcija je trajni proces prolaska kroz komade i označavanja ih kao imenovane cjeline poput ljudi, lokacija, organizacija itd.

Zaključak:

NLTK se koristi za klasifikaciju teksta, titlove slike, prepoznavanje govora, odgovaranje na pitanja, modeliranje jezika, rezimiranje dokumenata i mnoge druge operacije. Postoje mnogi drugi alati za obradu prirodnog jezika. No, NLTK ima širok raspon knjižnica što ga čini jednim od moćnih alata za obradu prirodnog jezika. Točniji je od bilo kojeg drugog alata, ali zbog velikog broja knjižnica, malo je spor. Dakle, sve ovisi o zahtjevima korisnika. Ako korisnik želi brzinu, tada može preferirati i druge alate, ali tada će morati kompromitirati točnost sadržaja. Ali ako je točnost prioritet onda oni svakako trebaju ići na NLTK.

Preporučeni članci:

Ovo je vodič za instaliranje NLTK-a. Ovdje smo raspravljali o osnovnom konceptu i različitim koracima za instaliranje NLTK-a na Windows i Linux \ Mac. Možete pogledati i sljedeće članke da biste saznali više -

  1. Ugradite Kubernetes nadzornu ploču
  2. Kako instalirati JDK
  3. Instalirajte Docker
  4. Kako instalirati Magento?
  5. Magento verzije | Značajke Magento verzije

Kategorija: