گوگل همه کتابهای جهان را شمرد! همه ۱۲۹,۸۶۴,۸۸۰شان را!
ارسال شده: یکشنبه 17 مرداد 1389, 6:59 pm
به تازگی یک هنرمند اهل اسلواکی، دست به کار جالبی زده است، وی در سردر موزه هنرهای مدرن بولونا، یک تونل احداث کرده است که دیوارههای آن از هزاران کتاب درست شده است. انبوهی کتابها و انعکاس جلدهای آنها هر کسی را شگفتزده میکند و ممکن است پارهای را هم تشویق به خواندن کتاب کند.
این عکسها را که دیدم، به این فکر افتادم که واقعا انسانها چند کتاب نوشتهاند! دقایقی بعد در کمال تعجب در جای دیگری به پاسخ سؤال خودم رسیدم:
سرویس کتابهای گوگل یا Google Books پروژه جاهطلبانهای است ک قصد دارد همه کتابهای جهان را دیجیتالی کند. وبلاگ رسمی این سرویس گوگل، دیروز در پستی (لینک پست : http://booksearch.blogspot.com/2010/08/ ... unted.html ) مطلب جالبی را مطرح کرد: آیا واقعا میشود برآوردی از کل کتابهای منتشر شده توسط نوع بشر داشت؟!
نخستین دشواری در راه رسیدن به پاسخ این سؤال این است که ما واقعا چه نوع انتشاراتی را کتاب محسوب کنیم. بنابراین باید تعریف درستی از وازه کتاب داشت. دشواری بعدی این است که آیا باید نسخههای مختلف از یک کتاب، مثلا باید چاپهای مختلف کتاب «هملت» را به صورت جداگانه شمرد یا نه. یا مثلا باید تفاوتی بین چاپ جلدسخت یک کتاب با چاپ معمولی آن ثائل شد یا نه.
کتابها شمارگان متفاوتی دارند، مثلا کتاب فرشتگان و شیاطین دن براون، میلونها جلد چاپ شده شده، در حالی که بعضی از پایاننامههای فقط دو سه جلد دارند. آیا باید کتابهای با شمارگان بسیار محدود را هم در آمار منظور کرد؟
ISBN یا سیستم بینالمللی استاندارد شمارهبندی کتابها، از نیمه دهه ۱۹۶۰ تعریف شد و تا سالهای اولیه دهه هفتاد به صورت گسترده مورد پذیرش قرار نگرفت. به علاوه این سیستم عمدتا منحصر به کتابهای منتشر شده در دنیای غرب باقی ماند. بنابراین بسیاری از کتابهایی که پیش از این تاریخ منتشر شده بودند یا توزیع تجاری نداشتند و یا اصلا در مناطق دیگر دنیا چاپ شده بودند، به وسیله این سیستم نمایه نشدند. مشکل دیگر ISBN وجود نقایصی در ان است. مثلا گوگلیهای متوجه شدند که پارهای از اوقات چندین کتاب یا یک شماره ثبت شدهاند یا این سیستم انتشارتی به غیر از کتاب مثل CD را هم نمایه کرده بود. بنابراین گوگل تکیه بر این سیستم را صلاح ندانست. گوگلیها متوجه شدند که سیستمها فهرستبندی کتابخانههای بزرگ دنیا مثل کتابخانه کنگره آمریکا هم نمیتواند به آنها در شمارش کل کتابهای دنیا کمک کند.
بنابراین گوگل تصمیم گرفت که خودش آستین را بالا بزند و با جمع کردن فراداده یا متادیتاهای کتاب از کتابخانههای مختلف، کاتالوگهای کتاب و توزیعکنندگان تجاری کتاب، اقدام کند. محاسبه اول، یک میلیارد جلد کتاب بود، اما با آنالیزهای چندباره و حذف کتابهای که بیش از یک بار منظور شده بودند و استفاده از یک الگوریتم، نهایتا گوگل به عدد ۲۱۰ میلیون جلد رسید. با حذف کردن شمارش میکروفیلمها، استاد صوتی، ویدئوها، نقشهها و همچنین اشتباهات شمارهبندی سریال کتابها، نهایتا گوگل به عدد ۱۲۹,۸۶۴,۸۸۰ رسید.
منبع : 1pezeshk.com
این عکسها را که دیدم، به این فکر افتادم که واقعا انسانها چند کتاب نوشتهاند! دقایقی بعد در کمال تعجب در جای دیگری به پاسخ سؤال خودم رسیدم:
سرویس کتابهای گوگل یا Google Books پروژه جاهطلبانهای است ک قصد دارد همه کتابهای جهان را دیجیتالی کند. وبلاگ رسمی این سرویس گوگل، دیروز در پستی (لینک پست : http://booksearch.blogspot.com/2010/08/ ... unted.html ) مطلب جالبی را مطرح کرد: آیا واقعا میشود برآوردی از کل کتابهای منتشر شده توسط نوع بشر داشت؟!
نخستین دشواری در راه رسیدن به پاسخ این سؤال این است که ما واقعا چه نوع انتشاراتی را کتاب محسوب کنیم. بنابراین باید تعریف درستی از وازه کتاب داشت. دشواری بعدی این است که آیا باید نسخههای مختلف از یک کتاب، مثلا باید چاپهای مختلف کتاب «هملت» را به صورت جداگانه شمرد یا نه. یا مثلا باید تفاوتی بین چاپ جلدسخت یک کتاب با چاپ معمولی آن ثائل شد یا نه.
کتابها شمارگان متفاوتی دارند، مثلا کتاب فرشتگان و شیاطین دن براون، میلونها جلد چاپ شده شده، در حالی که بعضی از پایاننامههای فقط دو سه جلد دارند. آیا باید کتابهای با شمارگان بسیار محدود را هم در آمار منظور کرد؟
ISBN یا سیستم بینالمللی استاندارد شمارهبندی کتابها، از نیمه دهه ۱۹۶۰ تعریف شد و تا سالهای اولیه دهه هفتاد به صورت گسترده مورد پذیرش قرار نگرفت. به علاوه این سیستم عمدتا منحصر به کتابهای منتشر شده در دنیای غرب باقی ماند. بنابراین بسیاری از کتابهایی که پیش از این تاریخ منتشر شده بودند یا توزیع تجاری نداشتند و یا اصلا در مناطق دیگر دنیا چاپ شده بودند، به وسیله این سیستم نمایه نشدند. مشکل دیگر ISBN وجود نقایصی در ان است. مثلا گوگلیهای متوجه شدند که پارهای از اوقات چندین کتاب یا یک شماره ثبت شدهاند یا این سیستم انتشارتی به غیر از کتاب مثل CD را هم نمایه کرده بود. بنابراین گوگل تکیه بر این سیستم را صلاح ندانست. گوگلیها متوجه شدند که سیستمها فهرستبندی کتابخانههای بزرگ دنیا مثل کتابخانه کنگره آمریکا هم نمیتواند به آنها در شمارش کل کتابهای دنیا کمک کند.
بنابراین گوگل تصمیم گرفت که خودش آستین را بالا بزند و با جمع کردن فراداده یا متادیتاهای کتاب از کتابخانههای مختلف، کاتالوگهای کتاب و توزیعکنندگان تجاری کتاب، اقدام کند. محاسبه اول، یک میلیارد جلد کتاب بود، اما با آنالیزهای چندباره و حذف کتابهای که بیش از یک بار منظور شده بودند و استفاده از یک الگوریتم، نهایتا گوگل به عدد ۲۱۰ میلیون جلد رسید. با حذف کردن شمارش میکروفیلمها، استاد صوتی، ویدئوها، نقشهها و همچنین اشتباهات شمارهبندی سریال کتابها، نهایتا گوگل به عدد ۱۲۹,۸۶۴,۸۸۰ رسید.
منبع : 1pezeshk.com