Daha önce OCR sistemlerinizi test etmek ya da eğitmek için kullanabileceğiniz sınırlı bir karakter verisetini burada paylaşmıştım.
Verisetine ihtiyaç duyanlar bunları elde etmenin ne kadar zor olduğunu bilirler. Hayat kurtarıcı sürpriz Google'dan geldi. ICDAR2007'de (Uluslararası Döküman Analiz ve Tanıma Konferansı) konuşmacı olarak yer alan Luc Vincent'ın müjdelediğine göre, Google şimdiye kadar Google Book Search sürecinde elde ettikleri, telif hakkı olmayan, verileri bir araya getirip araştırmacılar için kapsamlı bir veriseti hazırlama sürecine girmiş.
İlk ürünleri bir an evvel alabilmemiz umuduyla.
Kaynak: Google Book Search: Document Understanding on a Massive Scale, Vincent L.
No comments:
Post a Comment