OCR 3

AI 기술로 개선한 '결제내역 N분의 1' 앱: ChatGPT-4를 활용한 디자인 및 기능 업그레이드

이전에 OCR 기술을 활용해 카드 사용내역을 인식하고 계산하는 간단한 웹앱을 만들었습니다. 그때 AI를 이용한 자동인식 기능을 추가하겠다고 약속했는데, 드디어 그 약속을 지켜 프로젝트를 완성했습니다. ## 왜 다시 시작했나요?우연히 한 스타트업의 앱 정보를 보게 됐어요. 영수증 내역을 공유하고 계산하는 앱이었죠. 그걸 보면서 문득 깨달았습니다. "아, 스타트업의 성공은 아이디어보다 실행력이구나!"하지만 저는 조금 다르게 접근하기로 했어요. 요즘은 영수증보다 카드를 더 많이 쓰잖아요? 그래서 카드 내역을 활용하는 게 더 실용적일 거라고 생각했습니다.   이전에 만든 앱을 잠시봅니다. 먼가 디자인이 처참한데요.   이 프로젝트의 가장 큰 과제는 다양한 카드사의 이용내역 구조를 해석하는 것이었 습니다. 각 카..

카테고리 없음 2024.08.18

결제내역 캡춰화면 OCR 인식 후 합계 계산하기 (2) 프론트엔드 chatGpt 활용

파싱이 완료된 웹서비스의 프론트 화면을 만들어 보고자한다. 최근에 chatGpt 4 에서 이미지를 입력가능하도록 변경되었으며 사진을 입력하여 해당기능을 가진 프론트엔드 페이지를 제작해 달라고 하면 코드를 작성해 준다고한다. 아래와 같이 chatGPT 4 Vision attatch image 를 이용하면 계산기도 만들 수 있다고 한다. 이미지를 업로드 후 이런 모양의 계산기를 코딩해 달라고 하면 4칙 연산까지 실제 수행되는 웹앱을 만들어 주었다고 한다. 왼쪽이 캡춰해서 올려준 이미지이며 chatGPT가 제공해준 코드를 이용하여 브라우저에서 동작하는 계산기를 만들어 줬다고 한다. 데이터를 주고 화면을 그려달라고 한다. 정확한 요청사항을 주면 반영한다. 대략적인 형태도 알려준다. 여기에 추가로 수정가능하도록 ..

카테고리 없음 2023.10.22

결제내역 캡춰화면 OCR 인식 후 합계 계산하기 / tesseract js 5.0 텍스트인식 모바일 웹서비스 프로젝트

타이탄의 도구를 습득하고 있다. 2023 년 말까지 습득해야 하는 기술 또는 관심 있는 분야는 프런트 쪽에 활용분야이며 연말까지 학습하고자 하는 내용은 다음과 같다. three js / blander / opencv js / tesnorflow js / finetuning chatbot ( llama etc..) 최대한 다양한 툴을 학습하도록 하고자 한다. 이번에 목표로 하는 프로젝트는 영수증이나 사용내역을 인식하는 방법이다. 이 프로젝트를 시작하게 된 동기는 화면을 캡처 해서 쉽게 계산 내역을 확인하고 계산하여 지인이나 친구에게 전달하는 웹서비스를 만들기 위함이고 실제 개인적으로 유용성도 높지만 AI 툴을 사용하여 만들면 어떨까 하기 때문이다. 제작하는 웹섭비스 동작기능 : 캡춰된 카드 결제내역을 N ..

카테고리 없음 2023.10.19