pkg update
@pkgupdt@hl.pkgu.net
공공쪽에 있는 선배랑 이야기 해 보면, 한국 공공문서 양식은 A4 한 장에 그려내는 도형에 가깝다. 텍스트와 기호의 절대 위치, 복잡다단한 표가 글을 보기 전에 시각적 포인트를 잡아서 의미의 구조를 미리 보여주는 게 핵심. 한국 공공문서에서 한 장의 완결성을 위한 폰트 우겨넣기가 중요하고 웹이나 다른 비율의 종이에 올리면 의미가 깨지는 게 이 점 때문.
문제는 이걸 텍스트 스트림으로 주욱 풀면 종이 상 위치가 주는 의미가 날아가서 AI가 아니라 인간이라도 이해하가 어렵게 됨... ㅋㅋㅋ; 그래서 문서를 한장 한장 이미지처럼 인식해야 하는데 아직 이쪽은 잘 안 되고 있음.