Tudja Meg A Kompatibilitást Zodiac Sign Segítségével
A legjobb automatikus átírási eszközök újságírók számára
Tech & Tools

Siri most lett hat éves. Alexa most töltötte be a három évet. Ha telefonunkról lekérdezhetjük az albuquerque-i időjárást, és rákényszeríthetjük a nappalinkban lévő műanyag hengert, hogy hangosan olvassa a Washington Postot, miért írjuk át még mindig kézzel az interjúkat?
Nos, kiderült, hogy nem igazán kell. Az automatikus átíró eszközök már egy ideje a piacon vannak, és végre jóvá válnak. Most már csak néhány percet és néhány dollárt vesz igénybe, hogy hangot vagy videót töltsön fel egy webhelyre, és megkapja a meglehetősen átfogó átiratot.
De mint minden eszköz, egyesek jobbak, mint mások. Nyolc legnépszerűbb, újságíróknak szánt átírási eszközt teszteltünk (vagy próbáltunk tesztelni – erről később) Sárkány diktálás , Boldog Írnok , oÁtírás , rekordszerűen , Fordulat , Sonix , Trint és a YouTube. Mindegyik eszközt különféle valós forgatókönyveken futtattuk végig, kísérletezve azzal, hogy mindegyik hogyan teljesít az újságírók tipikus használatához képest.
Bár egyik eszköz sem volt tökéletes, az egyik a kategória legjobbjaként előzte meg a többit.
A mi választásunk
A pontosság, a funkciók és az egyszerű használat kombinációja teszi a Trint-et a legjobb választássá az újságírók automatikus átírására. Bár nem ez volt a legpontosabb, a legtöbb funkcióban gazdag vagy a legolcsóbb eszköz, amit kipróbáltunk, átiratszerkesztő eszközei és az a képessége, hogy egy kicsit zökkenőmentesebben illeszkedik az újságíró munkafolyamatába, segíti a versenytársak előnyét. Olvassa el, hogy megtudja, miért.
A kísérlet
Amint látni fogja, ezeknek az eszközöknek a pontossági aránya alacsony. Ez azért van, mert minden tőlünk telhetőt megtettünk, hogy összezavarjuk őket.
Először is, hogy az emberek, hangok és akcentusok széles körét tükrözzük, négy résztvevővel rögzítettük a hangmintánkat. A következőket tartalmazták:
- Alexios Mantzarlis , Poynter oktatója és a Nemzetközi Tényellenőrző Hálózat igazgatója, aki Rómából származik, és úgy jellemezte magát, hogy jópofa és „néhány vicces szó, amelyekben brit, olasz és furcsa amerikai akcentusok keverednek”.
- édes csokrok , a Nemzetközi Tényellenőrző Hálózat programvezetője, aki szeptemberben Mexikóvárosból érkezett Poynterbe.
- Kristen Hare , a Poynter riportere, aki úgy gondolja, hogy „kissé völgyes lányosnak” hangzik, amikor felvételeken hallgatja magát
- Én, és bár Kristen azt mondta, hogy „bivaly akcentusom van”, úgy gondolom, hogy a motyogásra, a túl gyors beszédre és a szavak egy részének kihagyására való hajlamom valószínűleg nagyobb kihívást jelent az átírásoknál (Ha feljegyzi magát az átírásra várva, az nyilvánvalóan egy kis önfeláldozáshoz vezet visszaverődés.)
Kristen a Google Hangouts/YouTube Live szolgáltatáson keresztül csatlakozott hozzánk ( közzététel: a Google News Lab támogatása részben finanszírozza a pozíciómat ), amely ellen a legtöbb automatikus átírási eszköz nyíltan figyelmeztet. A telefonból vagy a videocsevegésből származó hangot általában nehéz kezelni számukra.
Hogy még jobban megkínozzuk az algoritmusokat, a szövegrészeket is sokkal gyorsabban olvassuk, mint általában beszéljük, Dulce és Alexios sokféle idegen nyelven beszéltek (olaszul, spanyolul, franciául és görögül), a lehető legtöbb tulajdonnevet kiejtettük (Apalachicola , Michael Oreskes és különböző görög szigetek, hogy csak néhányat említsünk), kreatív lett az Urban Dictionary segítségével (a bőrönd Paul Manafortról és jogi helyzetének állapotát leíró nyers szóval) és bizonyos gyakorisággal beszéltek egymásról.
A 14 perces tesztünket a Poynter webinárium stúdiójában vettük fel, és legalább egy hangos repülőgép hangja szakított meg minket (néhány háztömbnyire van egy repülőtér), egy mentőjármű és Kristen telefonjának zörgése.
Háromféleképpen rögzítettük a hangot:
- Val,-vel Zoom H4nPro kézi mikrofon, közénk helyezve
- Az iPhone 6S Plus készülékemmel a Recordly alkalmazással rögzítem, a Zoom mellett elhelyezve
- Privát YouTube Live-val, így Kristen is csatlakozott hozzánk
Ezután feltöltöttük a hanganyagot az egyes eszközökbe, és nyomon követtük, mennyi ideig tartott az egyes eszközök átírása. A kapott átiratokat a Microsoft Word segítségével normalizáltuk, eltávolítottuk az időbélyegeket, és ellenőriztük, hogy a beszélők nevei egybevágóak legyenek. Ellenőrzésként magam írtam át a hangot (az oTranscribe segítségével), majd többször végighallgattam, hogy ellenőrizzem a teljes pontosságot. Kipróbáltuk a Rev fizetős szolgáltatást is, amely algoritmusok helyett emberi átírókat használ, hogy megnézzük, hogyan működik.
Számos dokumentum-összehasonlító eszközt teszteltünk, hogy megtudjuk, melyik működik a legjobban Copyscape mint a leghangosabb opció. Összehasonlítottuk az eszközök és szolgáltatások által generált átiratokat a 100 százalékosan helyes átírással, amelyet az oTranscribe segítségével készítettem.
Néhány további megjegyzés:
- A Zoom hangja a legjobb minőségűnek bizonyult, így a legtöbb tesztünkhöz ezt használtuk. Úgy tűnik, hogy a Recordly alkalmazás nem fogadja el a más forrásokból felvett hangot, így ez az egyik kivétel ez alól. A Zoom hanganyagot sem töltöttük fel a YouTube-ra, hanem a YouTube Live felvétel hanganyagára hagyatkoztunk. Az alma és narancs összehasonlítása miatt ez a kísérlet kevésbé tudományos, de jobban megfelel annak, hogyan használnák az újságírók ezeket az eszközöket a való világban.
- Bár ez egy népszerű eszköz, nem tudtuk tesztelni a Dragon Dictationt, mivel nem működik iOS 11-en. Frissítjük ezt az áttekintést, amikor és ha a fejlesztő javítja a problémát.
- A tesztelés előtt nem kerestük meg egyik céget sem, így nem történt különleges kezelés vagy háttér-finagling az átiratokkal. A Trint, a Sonix és a Recordly korlátozott ingyenes perceket kínál az új felhasználóknak, ezért ezeket kihasználtuk a kísérlethez. Egy nem riporter kolléga hitelkártyáját használtuk a Happy Scribe-hez, és nem említettük a Poyntert, mivel korábban leveleztem az alapítóival. És teljes árat fizettünk Rev emberi átírásáért. A YouTube feliratozási szolgáltatása és az oTranscribe mindig ingyenes.
- Sok-sok automatikus átírási eszköz létezik, amelyeket nem vettünk fel ebben az áttekintésben. Igyekeztünk azokra összpontosítani, amelyekről újságírók kérdeztek bennünket. Ha úgy gondolja, hogy méltánytalanul kihagytunk egyet, tudassa velünk, és frissítjük az értékelést.
Átirat minősége (nyertes: Happy Scribe)
Úgy tűnik, a mesterséges intelligencia felkelés miatt aggódó embereknek még legalább néhány évük van a felkészülésre, hiszen az általunk tesztelt egyetlen emberi átírási szolgáltatás nagy különbséggel verte az automatikus átírást.
Rev 82 százalékos pontossági besorolást ért el, az emberi fordító többnyire nem tudott idegen nyelveket fogni (ami, hogy őszinte legyünk, külön szolgáltatás), néhány tulajdonnév, némi áthallás, néhány szlengszó és motyogás. Bár a többi eszközből is többnyire hiányoztak ezek a dolgok, a Rev emberi átírói legalább olyan dolgokat vettek észre, mint a „[hallhatatlan]”, „[keresztmetszet]” és „[idegen nyelv]”, amelyek hasznos helyőrzők voltak a későbbi javításokhoz.
A Rev átirata még a hiányzó bitekkel is teljesen olvasható és koherens. Ha nem volt jelen az első beszélgetésnél, akkor megértheti annak lényegét, amiről beszéltünk, ha elolvassa.
A következő legpontosabb átírás a YouTube volt. A videómegosztó oldal automatikusan készített feliratokat a YouTube élő videónkhoz, amelyek 72 százalékban pontosak. De még az általános minőség mindössze 10 százalékos csökkenésével is az átirat lényegesen kevésbé olvasható, mint a Rev-é, mivel a YouTube nem biztosít írásjeleket vagy hangszóró-szegmentálást. A feliratok hatalmas szövegtömbként léteznek. A hanggal való párosítás nélkül szinte lehetetlen lenne, hogy valaki, aki nem vett részt a beszélgetésben, megértse a beszélgetésünket.
Vannak más árnyoldalai is a YouTube kínálatának, de ezekről akkor fogunk beszélni, amikor a funkciókhoz térünk.
A Happy Scribe bizonyult a legpontosabb, dedikált nem emberi átírási eszköznek, kísérletünkben 62 százalékos pontossággal. Az eszköz arra figyelmeztet a feltöltési oldalán, hogy „kerülje az erős háttérzajt, „kerülje az erős akcentusokat”, „kerülje a Skype- és telefonos interjúkat” és „tartsa közel a mikrofont a hangszóróhoz”, mindezt kötelességtudóan figyelmen kívül hagytuk.
Az átirat közel pontos azokon a helyeken, ahol beszéltem, különösen, ha nem volt áthallás, és nem használtam tulajdonneveket, de elég sokat küzdöttem Dulce, Kristen és Alexios átírásával. Egyes helyeken a különböző megszólalókat új bekezdésekre bontotta, máshol azonban kudarcot vallott. A teljes átirat egyes helyeken teljesen koherens, máshol pedig bizarr inkoherens között változik, például amikor Alexios azt mondta, hogy „nyissuk meg az Urban Dictionary-t, és végigmegyünk néhányon”, mivel „úgy értem, hogy a lányok még a városi szótárban is közel állnak egymáshoz. .”
A Trint hasonló eredményeket kínált, 61 százalékos pontossággal. Sok helyen elrontotta az ékezeteket, a YouTube-ról származó hangot és az áthallást vagy halk beszédet. Ennek ellenére nem pontosan olyan módon írta félre, mint a Happy Scribe. Az Urban Dictionary fentebbi mondata így jelent meg: „Úgy értem, még a városi szótárban is át tudunk menni ezeken”.
Összességében Trint átirata valamivel könnyebben olvasható, mint a Happy Scribe-é, mert jobban megkülönbözteti a beszélőket, és új bekezdésekre bontja őket. Nem tökéletes, de sok egyértelműséget ad hozzá, amikor működik.
A Sonix bizonyult a következő legpontosabbnak 50 százalékkal. A Sonix valamivel jobban működött, mint a Happy Scribe és Trint, amikor egyetlen hangszóró hangosan beszélt. De bármilyen áthallás, háttérzaj vagy akár nevetés – minden olyan dolog, ami valószínűleg megjelenik az eszköz bármely valós használatában – jobban összezavarta, mint a többit. Az Urban Dictionary mondatát így rögzítette: „Megnyitás a városi szótárban, és ezek közül néhányat végig tudunk menni”.
A többi eszközhöz hasonlóan a Sonix is megpróbálta a hangszórókat különböző bekezdésekre bontani, de úgy tűnt, hogy ez valamivel rosszabb volt.
A Recordly volt a legkevésbé pontos az automatikus átírási eszközök közül, 48 százalékos pontossággal. Ez az Urban Dictionary mondatot úgy ragadta meg, hogy „hadd nyissam ki azt a városi szótárt, és megtehetjük. Menj át néhányat”, ami nem rossz, de ez a szövegrész nem reprezentálja az átirat többi részét. A YouTube-hoz hasonlóan a Recordly átirata egy óriási szövegtömb. A YouTube-tól eltérően írásjeleket ad hozzá, bár ritkábban és kisebb pontossággal, mint a többi eszköz.
A Recordly átirata a legkevésbé hasznos a kontextusból.
Összességében a legjobb átiratot saját kezemből hoztam az oTranscribe segítségével. Revnek sikerült a legjobb átirata, amit nem kellett magamnak átírnom. De ez az automatikus átírási eszközök áttekintése, és ebben a kategóriában a Happy Scribe alig győzte le Trint, hogy az élre kerüljön.
Jellemzők (nyertes: Sonix)
Néhány dolog az automatikus átírási eszközök iparági szabványának tűnik. A feltöltött hang lejátszásának képessége nyilvánvaló. Minden eszköz lehetővé teszi a felhasználók számára az átiratok exportálását különböző formátumokban.
A böngésző alapú eszközök (ami a Recordly kivételével az összeset jelenti) egy közös csomagot is kínálnak. Mindegyik lehetővé teszi a felhasználók számára, hogy a szöveg különböző pontjaira kattintsanak, és közvetlenül a felvétel adott részére ugorjanak. Mindegyikben van lehetőség a hang lejátszására lassabb sebességgel (billentyűparancsokkal vagy a beállításokkal való babrálással), manuálisan szerkesztheti az átiratokat, feltölthet videót a hang mellett, és tárolhatja az átiratokat későbbi használatra.
A Trint egy lépéssel tovább megy, és az átirat alján a hang vizualizált hullámformáját tartalmazza, amelyet a felhasználók tetszés szerint átugorhatnak. Beépített eszközökkel is rendelkezik a szöveg megkeresésére és cseréjére, kiemelésére vagy kihúzására. A felhasználók felvehetik az eszközhöz a felszólalók névsorát, és minden bekezdéshez csatolhatják nevüket. Van egy praktikus funkciója is, amellyel egyetlen kattintással elküldheti az átiratot e-mailben.
A Sonix ezeket az eszközöket tartalmazza (az interaktív hullámforma kivételével), és még néhányat. A leghasznosabbak a „bizalom színei”, amelyek különböző színeket rendelnek a szavakhoz, amelyekben Sonix kevésbé bízik; hangminőség-értékelő, amely megmutatja, hogy a Sonix mennyire magabiztos az átírással kapcsolatban; és az automatikus hangszóró azonosítás, egy béta funkció, amely megpróbálja azonosítani a különböző hangszórókat, és azonosítókat rendelni hozzájuk.
Tesztünkben a Sonix csak két különböző hangszórót azonosított, így ez az eszköz némi munkát igényel, de még mindig rendkívül hasznos.
Recordly, az egyetlen alkalmazás (csak iOS-en) kínálja a legkevesebb funkciót. Ez nagyjából egy rekord és várj élmény. Az átirat az Apple beépített jegyzetalkalmazásához hasonló formátumban érkezik, korlátozott szerkesztési funkcióval. Azt is lehetővé teszi a felhasználók számára, hogy exportálják a hangot vagy a szöveget egy másik alkalmazásba.
Bár a Trint keresés és csere, valamint hullámforma funkciói hasznosak az átiratok korrigálásakor, a Sonix funkciói létfontosságú átláthatóságot adnak az átírási folyamathoz. És bár a hangszóróazonosító béta nem teljesen megbízható, ez egy ambiciózus eszköz, amely innentől csak jobb lesz.
Időzítés (nyertes: Happy Scribe, Trint és rekordszerűen)
Itt ragyog az automatikus átírás. Az összes eszköz az általunk benyújtott hangfájl hosszánál kevesebb perc alatt elkészítette az átiratot. A Happy Scribe (öt perc), a Trint (hat perc) és a Recordly (hat perc) közötti különbség elhanyagolható volt, de a Sonixnak kicsit tovább tartott (11 perc). (Frissítés: A Sonix képviselője megkereste, hogy a sebessége összhangban van a többi eszközével, ha a hangszóró-azonosító funkció ki van kapcsolva.) Valós környezetben ez döntő különbség lehet, különösen hosszabb átírások esetén.
A YouTube itt egy kicsit rejtélyes. Ennél az átiratnál mindössze néhány percbe telt, amíg az automatikus feliratok megjelentek. Korábbi tapasztalataink alapján azt tapasztaltuk, hogy a megjelenésük ideje meglehetősen eltérő lehet. Mivel a YouTube-ot nem igazán ily módon való használatra szánták, nem tudjuk, hogy ez általában mennyi ideig tart.
Körülbelül négy óra 15 percbe telt, mire Rev emberi átírói befejezték az átiratukat. Ennek körülbelül a fele kellett ahhoz, hogy magam csináljam meg az oTranscribe segítségével, de nem minden szünet nélkül, a Spotify Mély fókusz lejátszási lista és két gallon kávé.
Árképzés (nyertes: rekordszerűen)
Nem győzheti le az ingyeneset (YouTube, oTranscribe), de ami a dedikált automatikus átírási eszközöket illeti, a költségek nagyon eltérőek. A legjobb ár meghatározásához mérlegelnie kell, milyen gyakran használja az eszközt.
A Sonix a legdrágább, az alapcsomag havi 15 dollártól kezdődik, plusz 8 dollár minden átírt hang óránként. De az eszköz bő, 33 százalékos kedvezményt kínál, ha havi helyett évente fizet.
A Trint árat is kínál óránként 15 dollártól a feltöltés után fizetett átiratokért, vagy havi 40 dollártól akár három órányi átírt hangért. A további átírások óránként 13 dollártól északra kerülnek.
A Happy Scribe 10 centbe kerül percenként a feltöltött hangért. A kevésbé matematikai hajlamú típusoknál ez óránként 6 dollár.
Szerény óránként 2 dollárért, az első óra ingyenes, a Recordly messze a legolcsóbb automatikus átírási lehetőség.
Nem meglepő módon a Rev emberi átírói többe kerülnek, mint a többi eszköz. A 13 perces klipünk átírása 14 dollárba került, az időbélyegekért pedig 3,50 dollárral többet fizettünk. Ennek ellenére a munkaórák olcsó relatív költsége arra késztet bennünket, hogy elgondolkodjunk, hol vannak Rev átírói a világon, és milyen jó fizetést kapnak.
Könnyű használhatóság (nyertes: Trint)
Ezen eszközök egyike sem nehéz használni. Mindegyikhez feltölt egy fájlt (vagy hangot rögzít vele, Recordly esetében), és egy idő múlva elküldi a szerkeszthető átirat linkjét.
A Trint nagy lépést tesz a fájlfeltöltésen túl, és számos forrásból fogad hangot vagy videót, beleértve a Dropboxot, a Google Drive-ot és az FTP-t, és lehetővé teszi a felhasználók számára, hogy egyszerűen adjanak meg egy linket. Ez egyedülálló az általunk tesztelt eszközök között. A feltöltés megkezdése előtt Trint feltesz néhány hasznos kérdést a háttérzajról, az áthallásról és egyebekről. Ez nem javítja a felvételt, de hasznos UX-bólintás, amely megtanítja a felhasználókat, hogyan rögzítsenek több átírható hangot a jövőben.
A Happy Scribe, a Rev, a Sonix és a Trint mind e-mailt küldenek, amikor az átírás készen áll, így nem kell ülni és a képernyőt bámulni.
Alsó vonal
Nem ez a legolcsóbb, és nem is a legpontosabb általános átírási lehetőség, de a Trint nyert, mint a legjobb sokoldalú eszköz az általunk tesztelt eszközök közül.
Az alig több mint egy éves cég a Knight Alapítványtól kapott támogatást (jogi nyilatkozat: Poynter is kap finanszírozás a Knighttól) és a Google Digital News Initiative programja a funkcionalitás, a pontosság és az egyszerű használat legjobb kombinációját kínálja.
Csak a YouTube automatikus feliratozási funkciója, amely 72 százalékos pontosságot ért el, teljesített lényegesen jobban, mint a Trint az algoritmus által vezetett átírásban. A YouTube azonban nem olyan típusú átírásra készült, amelyre az újságíróknak napi szinten szükségük van, és nem kínál semmilyen szerkesztési funkciót.
Noha a fiatal induló Happy Scribe valamivel jobban teljesített a pontossági tesztjeink során, 62 százalékos aránnyal, és a Trint árának körülbelül egyharmadát éri el, számos olyan extra funkció hiányzik belőle, amelyek hasznossá teszik a Trintet. A sok forrásból történő feltöltési lehetőség, a szöveg és a hangszóró azonosításának keresése és cseréje kicsi, de fontos munkafolyamat-eszközök. Ha csak egy gyors és piszkos átiratot keres, a Happy Scribe lehet a megfelelő út.
És bár igaz, hogy a 61 százaléka messze nem tökéletes, tesztjeink kicsit nehezebbek voltak, mint a legtöbb valós felhasználás.
Teszteltük a Rev emberi fordítási szolgáltatást és az oTranscribe szolgáltatást is, amely praktikus eszközöket kínál az újságírók számára a hangok önálló átírására. 1 dollár/perc hangfelvételért azt találtuk, hogy a Rev túl drága ahhoz, hogy egy átlagos újságíró rendszeresen használja. És bár az oTranscribe hasznos volt, nem oldja meg az átírás fáradalmait és időigényét.
A tipikus felhasználási módokat szem előtt tartva a Trint a legjobb teljes körű automatikus átírási eszköz az újságírók számára.
Helyesbítés: Korábban beszámoltunk róla, hogy a Sonix nem ajánlat eszköz keresése és cseréje, de valójában megteszi. Elnézést kérünk a hiányzásért.
Tudjon meg többet az újságírási eszközökről a Try This! — Eszközök az újságíráshoz. Próbáld ezt! hajtja Google News Lab . Azt is támogatja a American Press Institute és a John S. és James L. Knight Alapítvány