Bölütlenmiş Karakterler, optik karakter tanıma(OCR) gibi uygulamalarınızda test/eğitim amacıyla kullanılabilecek 0-9 arası rakam ve büyük harflerden oluşan bir veri setidir. Veriler gerçek dünyadan edinildiği için veriler gürültülüdür.
An itibariyle hayli eksik olduğundan varolan veri setinizi genişletmek amacıyla kullanabilirsiniz.
Yanlışlıkları bitkidoku *AT* anlak *NOKTA* com eposta adresine bildirirseniz sevinirim.
Verisetinden örnekler:
Hangi karakterden kaç adet var?
Karakter | adet |
0 | 100 |
1 | 114 |
2 | 131 |
3 | 92 |
4 | 111 |
5 | 92 |
6 | 102 |
7 | 87 |
8 | 124 |
9 | 105 |
A | 191 |
B | 70 |
C | 69 |
D | 4 |
E | 6 |
|
Karakter | adet |
F | 1 |
G | 3 |
H | 31 |
K | 92 |
L | 6 |
M | 58 |
N | 5 |
O | 4 |
P | 47 |
T | 26 |
V | 1 |
X | 144 |
Y | 4 |
Z | 2 |
. | . |
|
toplam: 1821
Internet uzerinde bulunan benzer veri setlerinden bazilari:
[...] Daha önce OCR sistemlerinizi test etmek ya da eğitmek için kullanabileceğiniz sınırlı bir karakter verisetini burada paylaşmıştım. [...]
ReplyDelete