A Zodiákus Jelének Kompenzációja
Alkalmazhatóság C Hírességek

Tudja Meg A Kompatibilitást Zodiac Sign Segítségével

10 eszköz, amely segíthet az adatújságíróknak jobb munkában, hatékonyabban dolgozni

Hírlevelek

Nehéz egyformán jónak lenni az adatújságírás alá tartozó összes feladatban. Tovább rontja a helyzetet (vagy még jobb is), hogy az adatújságírók folyamatosan új módszereket és eszközöket fedeznek fel és alkalmaznak.

Kezdő adatújságíróként szeretné fejleszteni azt az érzést, hogy mások milyen eszközöket használnak az Ön által csodált munka elvégzéséhez. Nem fogja tudni egyszerre megtanulni őket, és nem is szabad próbálkoznia. Mindazonáltal fejlesztenie kell egyfajta környezettudatosságot a használt eszközökről (olyan, mint az a tudás, amelyet a Facebook ad középiskolai osztálytársai életéről). Vezessen egy listát a megtekintendő eszközökről. Tekintse meg a bemutatókat, és böngésszen a dokumentációban vagy a kódban. Aztán, amikor a projektjei igényt teremtenek, elég emlékezni fog ahhoz, hogy elkezdhesse.

Mégis azonnal válassz egy vagy két eszközt, és tedd őket DNS-ed részévé. Válassz egy szerszámot, és csavarj ki belőle mindent, amit tudsz. Olvass el mindent, amit találsz róla. Tanuljon meg minden egyediséget és optimalizálást. Vásároljon egy kávésbögrét a gyorsbillentyűkkel. Csak álljon készen arra, hogy új szerszámot vegyen fel, amikor úgy érzi, hogy van egy könnyebb út. Az alábbiakban 10 olyan eszközt mutatunk be, amelyek szinte minden adatújságíró eszköztárába tartoznak.

1. A táblázat

Szinte minden adatújságíró a táblázattal kezdi. (Közzététel: én kivételt képezek itt, akárcsak néhány más programozó-újságíró. Megtanultam a táblázatok használatát a rájuk támaszkodó kollégáimmal való együttműködéshez.)

A táblázat egy szinte univerzális adatformátum, különösen, ha az adatokat egyszerű szöveggel tagolt fájlként, például vesszővel elválasztott értékek fájlként menti. Mindenkinek van már kereskedelmi táblázatkezelő programja, vagy egyszerűen letöltheti a ingyenes és a modern táblázatkezelő alkalmazások rendkívül sokoldalúak.

Több is van oldalak és tanfolyamok táblázatkezelési készségek fejlesztéséhez. Kezdje a rendezéssel, szűréssel és részösszegekkel, majd lépjen tovább a fejlettebb képletekre. Ahogy megtanulja a képletek használatát, időnként próbálja meg közvetlenül beírni őket a varázslók használata helyett. Ez a gyakorlat alaposabb ismereteket ad az Ön által használt képletekről, és segít abban is, hogy elkezdje kódban kifejezni ötleteit, ami hasznos lesz, amikor más eszközöket használ.

2. SQL

Egy idő után elkezdheti érezni a táblázatok korlátai miatti csípést. Sok adatújságíró akkor választ relációs adatbázis-kezelőt (például SQLite, MySQL, PostgreSQL, Access), ha kettőnél több táblázatot kell csatlakoztatnia, vagy nagyon nagy adatkészleteket kell lekérdeznie. SQL Lehetővé teszi, hogy pontosan leírja a kinyerni kívánt adatok részhalmazát vagy a végrehajtani kívánt pontos változtatásokat, és lehetővé teszi ezen lekérdezések végrehajtását a kapcsolódó adatkészletekben. A parancsokat szkriptként is mentheti, így dokumentálhat mindent, amit az adatokkal végzett, és automatikusan megismételheti ezeket a lépéseket egy jövőbeli adatkészleten.

Szinte minden relációs adatbázis-program használja az SQL valamilyen ízét, így miután megtanulta az alapokat (pár tucat kulcsszót és néhány írásjelet), bármilyen rendszerben lekérdezhet adatbázisokat, legyen az ingyenes és kereskedelmi is. Emellett a relációs adatbázisokat gyakran használják az adatok webalkalmazásokban való tárolására, így az SQL-ismerete közvetlenül hasznos lehet a webfejlesztésben.

Íme egy oktatóanyag hogy elinduljon.

3. Adattisztító eszközök

Minden adatkészlet „piszkos”. Ismételje meg ezt magának háromszor, amikor kinyitja a laptopját.

Az adatok megtisztításához és hasznos formátumba hozásához valószínűleg különféle eszközöket kell használnia. A kedvencem Google Fine , amely kicsit úgy néz ki, mint egy táblázat, de olyan dolgokra készült, mint a nevek szabványosítása, így megbízható számlálásokat hozhat létre. (Szeretheti például, hogy a „János Smith”, „Smith, John” és „John Q. Smith” egy személynek számítson, nem pedig háromnak). Használata Google Refine Expression Language , képes leszel kifinomult adatátalakításokat végrehajtani, és újabb lépést teszel a kódban való kifejezésben. ( Data Wrangler egy új eszköz, amely a Refine-hez hasonló funkciókkal rendelkezik, és szintén érdemes megnézni.)

Ezenkívül ismernie kell az operációs rendszerben található eszközöket, amelyek segíthetik a fájlok és a bennük lévő adatok kezelését. Ha OSX-et vagy Linuxot használ, akkor igen de, awk, grep és megtalálja . (Vannak portok Windowshoz is.) Ezekkel a segédprogramokkal megkezdheti az adatok felfedezését és masszírozását anélkül, hogy akár egy táblázatkezelőt vagy adatbázis-programot is megnyitna.

És miközben a parancssori eszközöket nézi, nézze meg CSVKit , az újságírók által kifejlesztett elképesztő eszközkészlet, amely segít abban, hogy ebben a gyakori formátumban varázsoljon.

4. Vizualizációs eszközök

A vizualizáció nem dekoráció. Ez nem valami, ami csupán kíséri és illusztrálja az adatújságírást; ez a feladat központi eleme. A jó vizualizáció lehetővé teszi, hogy olyan kiugró értékeket és trendeket lásson, amelyek alapvetően megváltoztathatják az adatok megértését.

A legtöbb táblázatkezelő alkalmazás rendelkezik legalább alapvető diagramokkal és grafikonokkal (és gyakran kifinomultabb vizualizációkkal, amelyek bővítményeken keresztül érhetők el). Néhány web-alapú vizualizációs eszköz standard tarifává válik. Nézze meg Google Fusion Tables és Köztestület . Mindkettő egyszerű használatot és meglehetősen lenyűgöző eredményeket kínál.

Végül valami rugalmasabbra és erősebbre vágyhat; a szakértők gyakran olyan dolgokhoz fordulnak, mint a nyílt forráskód R statisztikai csomag, amely erőteljes elemző és vizualizációs eszközöket egyesít egy robusztus programozási nyelven.

5. Térképkészítő szoftver

A Google Fusion táblázatok és a Tableau Public egyaránt gyors és intuitív leképezési lehetőségeket kínálnak. Ha egyik térképük sem adja meg, amit akar, nézze meg az ingyenes QGIS térképező csomag. (Vagy ha a híradónak van tartalék engedélye, ArcView Hatékony kereskedelmi lehetőség.) A QGIS újságíró-központú bevezetőjéhez nézze meg ezt oktatóanyag .

Vannak olyan térbeli bővítmények is az adatbázis-kezelők számára, amelyek segíthetnek az adatokkal kapcsolatos földrajzi kérdések feltevésében. Kibővítik az SQL képességeit a földrajzi területekkel kapcsolatos lekérdezésekre, például egy határon belüli helyek azonosítására (pl. megye vagy kongresszusi körzet). PostGIS és SpatiaLite ingyenes és népszerű megoldások.

6. Szkriptnyelv

Válassz nyelvet, vegyél könyvet, oldj meg egy problémát. A programozás megtanulása gyorsan kibővíti adatújságírói hatókörét: a kormány nem adja meg a webhely mögötti adatokat? Kapard le. A meglévő eszközökkel nem sikerül a kívánt formában megszerezni az adatokat? Építsd meg a sajátodat. Bódító ereje van annak, ha nemcsak szoftverhasználóvá, hanem szoftvergyártóvá is válunk.

Nem mindegy azonban, hogy melyik nyelvet választja Piton és Rubin úgy tűnik, hogy a jelenlegi kedvencek az újságírók körében. Ha valaki, akit ismer, már dolgozik együtt Perl vagy PHP és hajlandó segíteni az indulásban, akkor érdemes ott kezdeni. A természetes nyelvekhez hasonlóan, ha egyszer megtanultunk egyet, a következőt könnyebb megtanulni, és sokkal fontosabb megtanulni programozóként gondolkodni, mint egy bizonyos szintaxist. (Az is előfordulhat, hogy a menő gyerekek egészen mást használnak, mire Ön jártas lesz a pillanatnyi nyelven.)

Ha a webes kaparással szeretne kezdeni, nézze meg A ProPublica kiváló kaparási útmutatója . ScraperWiki egy másik módja annak, hogy beáztassa a lábát, és példából tanuljon. Tanulj meg programozni nagyszerű bevezetés a programozási koncepciókba, amelyek történetesen a Rubyt használják célnyelvként.

7. Webes keretrendszer

Függetlenül attól, hogy eszközöket készít magának, vagy világméretű alkalmazásokat hoz létre, ha az internetre épít, szüksége van egy webes keretrendszerre: django Python számára, Sínek Ruby számára , szimfónia PHP-hez, Katalizátor Perl esetében válasszon.

A keretrendszer távol tartja az unalmas, ismétlődő munkát, segít a legjobb gyakorlatok átvételében, rendszerezi a munkát, és megkönnyíti a másokkal való együttműködést. Sok keretrendszerhez tartozik egy kattintásos telepítő, amely segíthet némileg enyhíteni a kezdéssel járó fájdalmakat. Vessen egy pillantást a Bitnamira django és Rubin például halmok.

A webes eszköz felépítése során elég sok HTML-t és CSS-t fog felvenni. De minden jel arra mutat, hogy a JavaScript növekvő jelentősége van az összes webfejlesztésben. Ha azt szeretné, hogy webalkalmazása inkább asztali alkalmazásnak tűnjön, ismerjen meg néhány JavaScriptet, különösen olyan könyvtárakat, mint pl. jQuery .

8. Rugalmas szerkesztő

A kód írásához kódszerkesztőre van szükség. Ez egy olyan szerkesztőt jelent, amely nem ejt okos, divatos karaktereket a szövegbe (rád nézve, Microsoft Word), és remélhetőleg hozzáad néhány csengőt és sípot, például nyelvspecifikus szintaktikai színezést, amely segít könnyen azonosítani a kulcsszavakat és más nyelveket. elemeket gépelés közben.

Nincs biztosabb módja a nerd verekedés elindításának, mint megkérdezni, melyik kódszerkesztő a legjobb. TextMate (Mac esetén) életképes kereskedelmi lehetőség. És Jegyzettömb++ (Windows esetén) egy jó ingyenes lehetőség. Vannak a végtelenségig testreszabható nyílt forráskódú lehetőségek is JÖTTEM és Emacs . Mindazonáltal készüljön fel egy tanulási görbére mindegyiknél. Végül néhány Java programozó azt fogja javasolni, hogy szüksége van egy teljes Integrált fejlesztői környezet . Ha valaki segít megtanulni kódolni, alkalmazza az ő szerkesztőjét, és tanuljon meg minden parancsikont és konfigurációs trükköt. A szerkesztő a legszemélyesebb eszköz, és érdemes otthon érezni a sajátját.

9. Revízió ellenőrzése

Te soha nem követsz el hibákat? Soha nem akarsz együttműködni senkivel? Akkor talán nem is kell felülvizsgálati ellenőrzés . De érdemes használni, ha elegáns módszert szeretne a biztonsági mentések mentésére, kipróbálni a fájlok ideiglenes verzióin, és egyesíteni a munkáját másokkal. A revízióvezérlés megtanulásának talán legegyszerűbb módja a használata Github . Telepítheti is megy vagy Felforgatás helyileg.

10. Dokumentumelemző eszközök

Az adatújságírás talán legizgalmasabb határvonala jelenleg a nagy dokumentumkészletek adatként való kezelésének kísérlete. DocumentCloud praktikus felületet biztosít a PDF formátum kötéseinek feloldásához, lehetővé téve a dokumentumok közötti keresést és az érdekes helyek kiemelését.

Lombfűrész egy olyan asztali szoftver, amely viszonylag nagy dokumentumkészletben való navigáláshoz hasznos. Végül érdemes lehet megvizsgálni az olyan csomagok számítási nyelvi potenciálját, mint pl Python természetes nyelvi eszközkészlete vagy a Stanford CoreNLP . És mivel az újságírók most karcolták meg ennek a területnek a felszínét, új eszközöket amelyek folyamatosan adatként kezelik a dokumentumokat.

Ez a második történet az adatújságírásról szóló kétrészes sorozatban. Itt olvashatja el az első történetet, „5 tipp az adatújságírás megkezdéséhez”.


Ez a történet is egy Poynter része Hackek/Hackerek sorozatot tartalmaz Hogyan kell ez arra összpontosít, amit az újságírók tanulhatnak a feltörekvő technológiai trendektől és az új eszközöktől.

Javítás: A történet egy korábbi verziója szerint a felhasználóknak fizetniük kell a Notepad++-ért. Valójában ingyenes.