accès aux groupes de discussion, consultation et publication d'articles, recherche de "newsgroups"...
membres, identifiez-vous
é-mail Mot de passe
nouveau ? mot de passe oublié ?
Chargement... Chargement en cours...

Groupes français belges canadiens suisses internationaux Nétiquette
Échangez opinions et commentaires dans les forums de discussion.

Re: Baza ręcznie pisanych liter

 [  Nouvelle Discussion Nouvelle discussion  |  Répondre au groupe Répondre au groupe  |  pl.sci.ai ] 

Retour : Accueil du site pl sci ai  


  Sujet:   Re: Baza ręcznie pisanych liter  
 De: __THINK__syl...@cox.net (Szpieg z Krainy Deszczowców)
 Groupes: pl.sci.ai
 Organisation: Nie pamietam
 Date: 04. May 2008, 18:00:30
 References: 1 2 3
Drogi kolego A.L.!

> Poczta w USA plynnie czyta komputerowo adresy pisane recznie z
> dokladnoscia 99%

No to akurat jest bałach. Akurat ja się w tym biznesie obracam i coś na ten
temat wiem. Obecne reguły MASS (Multiline OCR Accuracy Support System)
stanowią 1.5% błędnego kodowania i 7.5% niekodowania. Jest też specjalny
podzbiór, który musi być poprawnie zakodowany w 100%.

Wszystko to jest bardzo precyzyjnie opisane w wielu publikacjach dostępnych
na http://ribbs.usps.gov/. Proponuję zacząć od MASSTECH.PDF i CASSTECH.PDF.

Ta plotka o 99% może się brać z niezrozumienia innych programów, które mają
próg błędu 1%. Proszę zobaczyć "99% testing" na wyżej wymienionych stronach.

Jako tzw. "public-private partnership" jedna z reguł USPS mówi o tym, że nie
wolno jest publikować dokładnych danych o procentach błędów. Można tylko
publikować informację o tym, że dany produkt jest CASS-certified,MASS-certified
i tak dalej. Oznacza to tyle, że procent poprawnych odpowiedzi jest powyżej
ustalonego progu, ale ile powyżej jest poufne.

Kongres USA powierzył USPS zadanie ochrony danych adresowych obywateli
USA. W związku z tym wszystkie bazy danych i niektóre algorytmy są objęte
szczególną ochroną. Wielu z nich nie można eksportować poza granice USA
bez specjalnej licencji, np. DPV (Delivery Point Validation) i NCOALink (National
Change Of Address). Z tych to przyczyn nie będę się tutaj wdawał w dalsze
szczegóły. Dla zainteresowanych pewne informacje na poziomie podstawowym
dostępne są w http://ribbs.usps.gov/files/Addressing, zwłaszcza PUBS/AIS.PDF
i cały pod-katalog SAMPLES.

Mimo wszystkiego co powyżej napisałem, jakość OCR w systemach USPS
jest całkiem niezła. Wynika to przede wszystkim, że rezultatem OCR nie
jest wprost tekst adresu ale jego annotacja pobrana z najrozmaitszych baz
danych. Jeżeli np. dwuliterowy kod stanu zostanie przeczytany jako "<chlap>L"
to z bazy danych wynika, że może to być AL,FL lub IL (Alabama,Floryda,Illinois).
Uogólniając tą koncepcję na cały wielo-liniowy adres pocztowy oraz wiedząc,
że poszczególne bazy danych uaktualniane są od co-tydzień do co-miesiąć
można sobie wyobrazić, że końcowe wyniki są niezłe. Ale ma to niewiele
wspólnego z "rozpoznawaniem znaków" takim jakie to jest rozumiane
w sferach akademickich.

USPS ciągle zatrudnia wielu pracowników, których praca polega na podnoszniu
koperty jedną ręką, odczytywaniu adresu i wklepywaniu go na klawiaturze
drugą ręką. Potem specjalna drukarka plujka drukuje fluorescencyjnym
atramentem ten ręcznie wklepany adres, tak aby na wszystkich następnych
etapach sortowanie mogło odbywać się automatycznie.

Nie jest sekretem, że w styczniu tego roku miał być wprowadzony nowy
format kodów paskowych (Intelligent Mail Barcode zamiast starego POSTNET).
Obecnie wdrożenie to zostało odroczone do maja 2009.

W podsumowaniu: proszę nie wpadać w kompleksy porównując się z USPS.
Oni sobie nawet z kodami paskowymi nie najlepiej radzą a co tu dopiero
mówić o rozpoznawaniu pisma odręcznego.

Pozdrawiam,

Sylwek

PS. Za dwa tygodnie będę na National Postal Forum. Jeśli ktoś z tej grupy
ma jakieś dalsze pytania to proszę podać tutaj pytania. Ale proszę
wpierw zajrzeć do http://ribbs.usps.gov/. Na NPF będę jako gość, nie będę
miał żadnych oficjalnych zajęć, mogę więc dokonać rozpoznania
"state-of-the-art" praktycznych technologii dostępnych na rynku USA.
Oczywiście o ile mają jakieś zastosowania w przesyłkach pocztowych.


DateSujet  Auteur
01.05.
* Re: Baza ręcznie pisanyc
zdumiony
01.05.
`* Re: Baza ręcznie pisanyc
A.L.
04.05.
 `-   Re: Baza ręcznie pisanyc
Szpieg z Krainy Deszczowców
Groups Explorer contact votre avis comment ça marche? rechercher un groupe suggérer un groupe abuse accueil du site   Imprimer cette page   Envoyer cette page ŕ un(e) ami(e)
Free counter and web stats