Makale 1
Makale Adı: Digitization and Archiving of Company Invoices using Deep Learning and Text Recognition-Processing Techniques
Makale Özeti: Günümüzde, fatura, irsaliye ve makbuz gibi resmi belgelerin dijital ortamlara aktarılması ve doğru anlamsal ilişkilerin kurulması büyük önem taşımaktadır. Ancak, bu belgeleri anlamak ve işlemek, önemli zaman ve çaba gerektiren zor bir süreçtir. Son yıllarda derin öğrenme, görüntü ön işleme, metin tespiti ve optik karakter tanıma (OCR) teknolojilerinin kullanımı bu süreci kolaylaştırmıştır. Ancak, metin tanıma ve işleme tekniklerinin doğru sonuçlar üretebilmesi için belgelerin temiz ve okunabilir olması gerekmektedir. Ayrıca, zaman alıcı, yorucu, hataya açık ve maliyetli insan gücüne dayalı dijitalleştirme süreçlerinden kaynaklanan zorlukların azaltılması gerekmektedir. Bu çalışmanın amacı, güncel yapay zeka teknolojilerini kullanarak taranmış faturalar ve benzeri resmi belgeleri dijitalleştirip arşivlemektir. Böylece zaman, maliyet ve insan kaynakları gibi bileşenlerin en etkili şekilde kullanılması sağlanacaktır. Çalışmada kullanılan veri seti, 10.000 ".jpg" görüntü dosyası ve 10.000 ".xml" veri dosyasını içermektedir. ResNet-50 mimarisi ile eğitilen model, veri setinden rastgele seçilen görüntüler üzerinde %97'ye varan doğruluk oranlarıyla metin tespit edebilmektedir. Bir kişinin ayda ortalama 2.112 belge işleyebildiği bir ortamda, eğitilmiş yapay zeka modelinin ayda 108.000 belge işleyebileceği öngörülmektedir. Bu geliştirilen yöntemle, işletmeler faturalar, irsaliyeler ve makbuzlar gibi resmi belgeleri hızlı bir şekilde dijitalleştirip arşivleyebilecektir. Gelecek çalışmalarda, daha büyük ve çeşitli veri setleri kullanarak daha iyi sonuçlar üretebilecek yeni yöntemlerin geliştirilmesi önerilmektedir.
Abstract: Nowadays, it is crucial to transfer official documents such as invoices, dispatch notes, and receipts into digital environments and establish correct semantic relationships. However, understanding and processing these documents is a difficult process that requires significant time and effort. In recent years, the use of deep learning, image preprocessing, text detection, and optical character recognition (OCR) technologies have made this process easier. However, for text recognition and processing techniques to produce accurate results, documents must be clean and readable. Additionally, difficulties arising from time-consuming, tiring, error-prone, and cost-incurring human-powered digitalization processes must be reduced. The aim of this study is to digitize and archive scanned invoices and similar official documents using current artificial intelligence technologies, thereby enabling the most effective use of components such as time, cost, and human resources. The dataset used in the study includes 10,000 ".jpg" image files and 10,000 ".xml" data files. The model trained with the ResNet-50 architecture can detect text with accuracy rates of up to 97% on randomly selected images from the dataset. In an environment where a person can process an average of 2,112 documents per month, it is predicted that the trained artificial intelligence model can process 108,000 documents per month. With this developed method, businesses can quickly digitize and archive official documents such as invoices, dispatch notes, and receipts. Future studies propose the development of new methods that can produce better results using larger and more diverse datasets.
Makale Linki : https://www.imiens.org/index.php/imiens/article/view/41