anlak.com

Bölütlenmiş Karakterler v0.1

, Saturday, 30 September 2006
Bölütlenmiş Karakterler, optik karakter tanıma(OCR) gibi uygulamalarınızda test/eğitim amacıyla kullanılabilecek 0-9 arası rakam ve büyük harflerden oluşan bir veri setidir. Veriler gerçek dünyadan edinildiği için veriler gürültülüdür. An itibariyle hayli eksik olduğundan varolan veri setinizi genişletmek amacıyla kullanabilirsiniz. Yanlışlıkları bitkidoku *AT* anlak *NOKTA* com eposta adresine bildirirseniz sevinirim.

Verisetinden örnekler:


Hangi karakterden kaç adet var?

Karakter adet
0 100
1 114
2 131
3 92
4 111
5 92
6 102
7 87
8 124
9 105
A 191
B 70
C 69
D 4
E 6

Karakter adet
F 1
G 3
H 31
K 92
L 6
M 58
N 5
O 4
P 47
T 26
V 1
X 144
Y 4
Z 2
. .
toplam: 1821



Internet uzerinde bulunan benzer veri setlerinden bazilari:

1 comment:

  1. [...] Daha önce OCR sistemlerinizi test etmek ya da eğitmek için kullanabileceğiniz sınırlı bir karakter verisetini burada paylaşmıştım. [...]

    ReplyDelete