Makale 1

Makale Adı: Digitization and Archiving of Company Invoices using Deep Learning and Text Recognition-Processing Techniques

Makale Özeti: Günümüzde, fatura, irsaliye ve makbuz gibi resmi belgelerin dijital ortamlara aktarılması ve doğru anlamsal ilişkilerin kurulması büyük önem taşımaktadır. Ancak, bu belgeleri anlamak ve işlemek, önemli zaman ve çaba gerektiren zor bir süreçtir. Son yıllarda derin öğrenme, görüntü ön işleme, metin tespiti ve optik karakter tanıma (OCR) teknolojilerinin kullanımı bu süreci kolaylaştırmıştır. Ancak, metin tanıma ve işleme tekniklerinin doğru sonuçlar üretebilmesi için belgelerin temiz ve okunabilir olması gerekmektedir. Ayrıca, zaman alıcı, yorucu, hataya açık ve maliyetli insan gücüne dayalı dijitalleştirme süreçlerinden kaynaklanan zorlukların azaltılması gerekmektedir. Bu çalışmanın amacı, güncel yapay zeka teknolojilerini kullanarak taranmış faturalar ve benzeri resmi belgeleri dijitalleştirip arşivlemektir. Böylece zaman, maliyet ve insan kaynakları gibi bileşenlerin en etkili şekilde kullanılması sağlanacaktır. Çalışmada kullanılan veri seti, 10.000 ".jpg" görüntü dosyası ve 10.000 ".xml" veri dosyasını içermektedir. ResNet-50 mimarisi ile eğitilen model, veri setinden rastgele seçilen görüntüler üzerinde %97'ye varan doğruluk oranlarıyla metin tespit edebilmektedir. Bir kişinin ayda ortalama 2.112 belge işleyebildiği bir ortamda, eğitilmiş yapay zeka modelinin ayda 108.000 belge işleyebileceği öngörülmektedir. Bu geliştirilen yöntemle, işletmeler faturalar, irsaliyeler ve makbuzlar gibi resmi belgeleri hızlı bir şekilde dijitalleştirip arşivleyebilecektir. Gelecek çalışmalarda, daha büyük ve çeşitli veri setleri kullanarak daha iyi sonuçlar üretebilecek yeni yöntemlerin geliştirilmesi önerilmektedir.


Abstract: Nowadays, it is crucial to transfer official documents such as invoices, dispatch notes, and receipts into  digital  environments  and  establish  correct  semantic  relationships.  However,  understanding and processing these documents is a difficult process that requires significant time and effort. In recent years, the use of deep learning, image preprocessing, text detection, and optical character recognition (OCR) technologies have made this process easier. However, for text recognition and processing  techniques  to  produce  accurate  results,  documents  must  be  clean  and  readable. Additionally,  difficulties  arising  from  time-consuming,  tiring,  error-prone,  and  cost-incurring human-powered digitalization processes must be reduced. The aim of this study is to digitize and archive  scanned  invoices  and  similar  official  documents  using  current  artificial  intelligence technologies, thereby enabling the most effective use of components such as time, cost, and human resources. The dataset used in the study includes 10,000 ".jpg" image files and 10,000 ".xml" data files. The model trained with the ResNet-50 architecture can detect text with accuracy rates of up to  97%  on  randomly  selected  images  from  the  dataset.  In  an  environment  where  a  person  can process  an  average  of  2,112  documents  per  month,  it  is  predicted  that  the  trained  artificial intelligence  model  can  process  108,000  documents  per  month.  With  this  developed  method, businesses can quickly digitize and archive official documents such as invoices, dispatch notes, and receipts.  Future  studies  propose  the  development  of  new  methods  that  can  produce  better results using larger and more diverse datasets.


Makale Linki : https://www.imiens.org/index.php/imiens/article/view/41