Serverless 기반 신문 PDF 정형화
Overview 이미지만을 고려하는 기존 OCR 서비스와는 달리, PDF에 담긴 정보까지 이용해 모바일 기사로 나타낼 수 있는 정보를 만드는 Serverless 기반 백엔드와 검수용 프론트엔드 개발 프로젝트 요구 사항을 분석해 AWS Serverless 서비스들을 이용한 구조로 문제를 쪼개고 각 Lambda의 초중반부 개발을 진행했습니다. 수백 건 단위의 Lambda concurrency를 동원해 수십 페이지 단위의 PDF 정형화를 동시에 진행할 수 있었습니다. Technology S3 presigned url을 이용해 PDF를 업로드하면 PDF 정형화 Step Function이 호출되도록 구성 PDF를 HTML로 변환해서 좌표 정보를 추출하는 Lambda 개발 및 유지 보수 Step Functions Activity Worker 를 이용한 이미지 처리 Worker 개발 모든 Lambda와 Step Function의 event payload 문서화 및 관리 Milestones 마일스톤 별로 집중했던 개발 내용에 따라서 정리했습니다. ...