Car-tech

Google: 129 miljoner olika böcker har publicerats

TITTAR PÅ VINNAREN AV WORLD CUP! *HAN VANN 30 MILJONER KRONOR!*

TITTAR PÅ VINNAREN AV WORLD CUP! *HAN VANN 30 MILJONER KRONOR!*
Anonim

För de som någonsin undrat hur många olika böcker som finns där ute, har Google ett svar för dig: 129.864.880, enligt Leonid Taycher, en Google-programvaruingenjör som arbetar med Google Böcker-projektet.

Beräkning av numret av böcker i världen är mer än en övning i nyfikenhet för sökjätten: Den ger också en färdplan för något av det arbete som fortfarande är kvar att göra för att möta företagets ambitiösa mål att organisera all världens information.

"När du är en del av ett företag som försöker digitalisera alla böcker i världen. Den första frågan du ofta får är: "Hur många böcker finns där ute?", förklarade Taycher i ett blogginlägg som meddelade uppskattningen.

[Vidare läsning: De bästa TV-streamingtjänsterna]

För att komma fram till en rimlig tillnärmning började företaget med att ta in bokinformation från flera katalogiseringssystem, såsom International Standard Book Numbers (ISBN).

Sådana kataloger ger, trots att de är användbara, inte en slutgiltig räkning, dock. Till exempel har ISBN-nummer bara tilldelats böcker sedan 1960-talet, och brukar användas endast i de västra länderna.

Även flera böcker har tilldelats enskilda ISBN-nummer och utgivare har tilldelat ISBN-nummer till andra än böcker, Så Google-ingenjörer har skrivit program för att kamma om ungefär 150 sådana kataloger och kataloger, och eliminera så många dubbla poster som kunde hittas.

Företaget fick också göra ett antal tuffa beslut om vad som är och är inte en bok, förklarade Taycher.

Exempelvis räknas mjuka omslag och hårda omslag av texter som två böcker, liksom de många olika versionerna av en populär text, som Shakespeare "Hamlet", på grund av förord ​​och kommentarer som de kan innehålla. Serier kan räknas som enskilda böcker eller som samlat arbete.

I juni har företaget skannat 12 miljoner böcker enligt en presentation från Google Books tekniska chef Jon Orwant vid USENIX års tekniska konferens i Boston. Dessa böcker har skrivits på ungefär 480 språk (inklusive 3 böcker i Star Trek-ursprung Klingonspråk).

Företaget planerar att slutföra skanningen av befintliga böcker inom ett decennium. Den resulterande virtuella samlingen kommer att bestå av fyra miljarder sidor och två biljoner ord, Orwant sa.

Omkring 20 procent av världens böcker är offentliga, förklarade Orwant. Omkring 10 till 15 procent av dessa böcker finns i tryck. De återstående böckerna - de allra flesta av alla titlar - är fortfarande upphovsrättsliga men inte tillgängliga. Google håller på att låna kopior av dessa böcker för att digitalisera dem, från cirka 40 stora bibliotek över hela världen.

Det är denna skanningsåtgärd i böcker som inte är skrivna men fortfarande omfattas av upphovsrätt som har uppfyllts med en viss motstånd från förlagsbranschen.

Företaget väntar nu på en dom från den amerikanska tingsrätten för södra distriktet i New York om huruvida det kan skanna dessa böcker.

År 2005 var författarnas Guild och Föreningen för amerikanska utgivare inlämnade separat klagomål mot sökgiganten och hävdade att företaget bryter mot upphovsrätten genom att skanna i böckerna.

Google har hävdat att det vill sälja digitala kopior av dessa annars out-of- skriva ut böcker och avsätta royalties för författarna att göra anspråk på. Företaget hoppas också kunna avslöja utdrag av dessa böcker i webbsökningar, och hävdar att användningen faller under US Fair Use-doktrinen.

Skanning i alla världens böcker kommer att leda till andra fördelar förutom att förbättra sökningar, förklarade Orwant. När alla dessa volymer har digitaliserats kan deras innehåll analyseras, vilket kan leda till nya insikter. Lingvister kan upptäcka när vissa ord kom i stor utsträckning, eller som först börjar använda dessa ord.

Google boksökning kan också hjälpa till att svara på några enastående historiska frågor: Det kan till exempel informera debatten om huruvida Isaac Newton och Gottfried Leibniz - eller någon annan helt - uppfann kalkyl.

"Vi kan söka inte bara för en fras men för ett koncept, förklarade Orwant. "Vi kan ta alla olika sätt [att tanken på] oändlighet kan böjas, översätta det på olika språk och göra en sökning parallellt."

"Mitt hopp är att när vi börjar exponera mycket mer av Den här samlingen kommer att låta människor ställa frågor som det inte har kunnat fråga tidigare, säger han.

IDG News Service redaktör Juan Carlos Perez bidrog till denna rapport.

Joab Jackson täcker företagsprogramvara och allmän teknik som bryter nyheter för IDG News Service. Följ Joab på Twitter på @Joab_Jackson. Joabs e-postadress är [email protected]