Kako instalirati Apache

Prije nego što unesemo kako instalirati dio Apache, prvo bismo imali opći pregled Apache i kako se koristi u znanosti podataka.

Što je Apache?

Apache Web Server je HTTP poslužitelj koji posjetiteljima predstavlja web stranice koje dolaze na vaš poslužitelj. Ako želite implementirati web mjesto za tvrtku ili organizaciju, najvjerojatnije ćete za to koristiti Apache.

Postoje vani i drugi HTTP poslužitelji, poput IIS-a, ali Apache je standard koji većina ljudi koristi, bili oni na Linuxu, Windows-u ili Macu. Apache je zadana postavka na koju većina ljudi ide jer je dobro poznata, vrlo je pouzdana i besplatna.

Međutim, jedna stvar koju treba shvatiti s Apacheom je da je HTTP poslužitelj, pa ako to instalirate na Linux ili Windows ili Mac, sve što biste mogli učiniti je da predstavite statičke web stranice posjetiteljima koji dolaze na vaš poslužitelj. Dakle, ako kodirate HTML web mjesto bez drugih programskih jezika osim JavaScript-a, možete ih koristiti sa samo Apache poslužiteljem. Možete staviti sve svoje oznake na Apache server i predstaviti ga posjetiteljima.

Kako se Apache koristio u Data Scienceu?

Znanost o podacima najzahtjevnija je studija u modernom svijetu. Data Scientist smatra se najseksipilnijim poslom u 21. stoljeću, a profesionalci iz različitih disciplina žele naučiti i postati Data Scientist. Apache igra ključnu ulogu kod svakog entuzijasta koji se bave podacima, jer im je potrebno dovoljno znanje o Apache Hadoop ekosustavu.

Ekosistem Apache Hadoop

Prva stvar je da Hadoop ekosustav nije jedno sredstvo. To nije programski jezik ili samo jedan okvir. Riječ je o grupi alata koje različite tvrtke zajedno koriste u različitim domenama za više zadataka. Proći ćemo svaki alat po jedan u nastavku: -

  • Apache HDFS (Hadoop Distributed File System) je Hadoop-ova jedinica za pohranu koja može pohraniti strukturirane, polustrukturirane i nestrukturirane podatke. HDFS ima metapodatke koji održavaju datoteku dnevnika o pohranjenim podacima. Sadrži dvije komponente - NameNode i DataNode.
  • Apache pređa je pregovarač resursa koji obavlja sve aktivnosti obrade poput planiranja zadataka, raspodjele resursa itd. Ima dvije usluge - Prvo je Upravitelj resursa koji raspoređuje aplikacije koje se pokreću na vrhu Pređe. Drugo je Upravitelj čvorova koji nadzire korištenje resursa .
  • Apache Map Reduce je komponenta obrade podataka tvrtke Hadoop koja obrađuje velike skupove podataka koristeći raspodijeljeno i paralelno računanje na temelju funkcija Map, Sort and Shuffle, and Reduce. Funkcija karte filtrira podatke, zatim vrši sortiranje i miješanje, a na kraju Smanji funkcija objedinjuje i zbraja rezultat.
  • Svinja Apache koristi se uglavnom u ETL-u. Ima dva dijela - svinjsku latinu i vrijeme svinje. Svinjski latinski jezik je jezik koji se koristi za obradu podataka korištenjem upita, dok je vrijeme izvođenja svinje okolina izvršenja. Jedan red svinjskog latiničnog jezika gotovo je jednak 100 redaka koda za smanjenje karte. Proces uključuje prvo učitavanje podataka, a zatim grupiranje, sortiranje, filtriranje i spremanje u HDFS.
  • Apache Hive koristi upitnik sličan SQL-u za analizu podataka u raspodijeljenom okruženju. Sadrži dvije komponente - naredbenu liniju košnice i poslužitelj JDBC / ODBC, a korišteni jezik naziva se HiveQL.
  • Apache Mahout je knjižnica strojnog učenja napisana na Javi i koristi se za izradu aplikacija za strojno učenje poput klasteriranja, klasifikacije ili regresije. Ima različite algoritme ugrađene za različite slučajeve uporabe.
  • Apache HBase je NoSQL baza podataka napisana na Javi koja radi preko Hadoopa. Građen je na temelju Googleove BigTable i može obrađivati ​​sve vrste podataka.
  • Apache Sqoop je alat za gutanje podataka koji se koristi za skupno strukturirani prijenos podataka između RDBMS i Hadoop.
  • Apache Flume je još jedan alat za gutanje podataka koji se koristi za polustrukturirani i nestrukturirani prijenos podataka između Hadoopa i drugih izvora podataka.
  • ZooKeeper je koordinator koji osigurava koordinaciju između različitih alata u Hadoop ekosustavu.
  • Apache Ambari je menadžer klastera koji osigurava, upravlja klasterima Hadoop-a i nadgleda njihovo zdravlje i stanje.
  • Apache Tez novi je alat u ekosustavu Hadoop koji ubrzava obradu Hadoopovih upita.
  • Apache Presto je distribucijski SQL upit otvorenog koda koji omogućava mogućnost upita na više platformi.
  • Apache HCatalog je sustav upravljanja metapodacima i tablicama za Hadoop koji omogućava interoperabilnost u svim alatima za obradu podataka. Također pomaže korisnicima da odaberu najbolje alate za svoje okruženje.
  • Apache Spark najrašireniji je i najpopularniji okvir među podacima znanstvenika. To je brzi računalni sustav klastera koji optimizira korištenje resursa u slučaju mnogih iterativnih zadataka. Pruža fleksibilnost i za serijsku obradu i za analizu podataka u stvarnom vremenu.

Ispod su koraci za instaliranje Apachea

Do sada smo saznali o Apacheu i kako je korisno za sve koji žele naučiti Data Science ili Big Data Analytics. Sada ćemo zaroniti i instalirati apache na prozore na temelju sljedećih koraka.

  • Idite na https://httpd.apache.org/ i kliknite vezu za preuzimanje ispod Apache httpd 2.4.38 Objavljen odjeljak.

  • Preusmjerit će vas na sljedeću stranicu, a zatim kliknite Datoteke za Microsoft Windows.

  • Kliknite na Apache Lounge.

  • Možete preuzeti 32-bitnu ili 64-bitnu zip datoteku na temelju vašeg Windows operativnog sustava. Ovdje ćemo preuzeti 64-bitnu verziju. Kliknite odgovarajuću .zip vezu za preuzimanje.

  • Sada mu je potreban C ++ Redistributable Visual Studio 2017. Stoga ćemo ga preuzeti s odgovarajuće 32-bitne ili 64-bitne veze

  • Nakon što obje datoteke budu preuzete, prvo idemo na mjesto za preuzimanje i instaliramo C ++ Redistributable Visual Studio 2017. Dvaput kliknite na .exe datoteku.

  • Označite "Slažem se" i kliknite Instaliraj.

  • Instalacija Apache je u tijeku.

  • Jednom kada bude kompletan, dobit ćete ovakvu poruku. Kliknite Zatvori da biste dovršili instalaciju.

  • Sada idite u mapu u koju preuzimate zip datoteku Apache. Kliknite desnom tipkom miša na nju i odaberite ekstrakt ovdje.

  • Sada ćemo kreirati mapu Apache24. Kopirajte ovu mapu na pogon C i tada ćemo dodati put do varijabli okruženja sustava.

Idite na Svojstva sustava -> kartica Napredno -> Pritisnite gumb Promjena okoliša u nastavku.

  • U varijabli pronađite Put i kliknite Uredi.

  • Kliknite Pregledaj -> Idite u mapu C pogona Apache24 -> Odaberi mapu kante -> Kliknite U redu.

  • Instalirat ćemo Apache kao Windows servis. Pokrenite naredbeni redak kao administrator. Upišite httpd –k instaliraj i pritisni enter.

  • Provjerit ćemo uslugu instaliranja Apache. Kliknite ikonu sustava Windows i upišite usluge. Kliknite aplikaciju Usluge i potražite uslugu s imenom Apache24.

  • Da biste pokrenuli Apache server, desnom tipkom miša kliknite na njega i kliknite start. Status će se promijeniti u 'Trčanje'.

  • Možemo testirati pomoću preglednika. Otvorite preglednik i idite na http: // localhost i pritisnite enter. Poruka u kojoj se kaže da "radi!" će se pojaviti za potvrdu uspješne instalacije Apachea.

Preporučeni članci

Ovo je vodič za Kako instalirati Apache. Ovdje smo razgovarali o uputama i različitim koracima za instaliranje Apachea. Možete pogledati i sljedeći članak da biste saznali više -

  1. Intervju pitanja Apachea
  2. Apache Spark vs Apache Flink
  3. Apache Hadoop i Apache Spark
  4. Apache Kafka vs Flume
  5. Kafka vs Kinesis | Glavne razlike

Kategorija: