사용자 설명서
Adobe PDF
PDF 파일은 코드 차트와 가사 시트를 저장하고 인쇄하기 위한 인기 있는 옵션입니다. 디지털 라이브러리를 정리하기 위해 PDF 파일을 몇 년 동안 사용해 오셨을 수도 있습니다. Adobe PDF 파일 형식은 인쇄된 페이지를 정확하게 표현하는 데 탁월하며 다양한 컴퓨터 플랫폼 간에 이식 가능합니다. 이 파일 형식의 몇 가지 문제점과 최적의 결과를 위해 텍스트를 추출하는 방법을 살펴보겠습니다.
Adobe PDF 파일은 OnSong에서 "있는 그대로" 표시되며 편집, 형식 지정 또는 낮은 조명 모드에 참여할 수 없습니다. 이러한 파일에 텍스트가 포함될 수 있지만 인쇄할 수 있도록 배치되어 있으며 다른 앱에서 쉽게 이해하거나 수정할 수 없습니다. 또한 PDF 파일은 그래픽이나 스캔한 이미지로 구성되거나 이들의 조합으로 구성될 수 있습니다. 또한 콘텐츠 추출을 방지하는 암호화될 수도 있습니다. 이 때문에 모든 PDF 파일이 다르므로 텍스트 기반 문서로 완벽하게 변환할 방법이 없습니다.
OnSong 내에서 Song Editor를 사용하고 화면 키보드가 표시되기 전에 나타나는 Conversion Toolbar에서 Extract Text 버튼을 탭하여 PDF 파일의 텍스트를 추출할 수 있습니다. OnSong은 먼저 PDF 파일에서 텍스트를 추출하려고 시도하고, 텍스트가 없으면 OCR(광학 문자 인식)을 사용하여 파일을 처리합니다. 결과는 대부분 텍스트로 끝나겠지만 텍스트를 검토하고 OnSong이 이해하는 파일 형식으로 조정해야 합니다. 또한 파일이 암호화된 경우 추출 결과가 손상된 문자로 표시될 수 있습니다. 이러한 파일은 작성 소프트웨어에서 적용한 보호로 인해 추출할 수 없습니다.
다음은 추출된 PDF 파일에서 발생할 수 있는 몇 가지 문제입니다:
잘못된 간격
일부 텍스트가 순서대로 배치되지 않거나 간격이 좋지 않을 수 있습니다. PDF 파일은 여러 텍스트 조각을 사용하여 텍스트를 정렬하기 위해 텍스트 바로가기를 사용할 수 있기 때문입니다. OnSong은 프레임 근접 계산을 사용하여 이러한 텍스트 조각을 서로 가깝게 배치하려고 하지만 수동으로 수정해야 할 문제가 있을 수 있습니다.
여백이 있는 코드
모든 코드 차트는 작성자와 사용된 소프트웨어에 따라 다르게 작성됩니다. 예를 들어, 원본 파일은 코드를 가사 위에 정렬하기 위해 여러 공백 문자를 사용했을 수 있습니다. 가변 폭 글꼴을 사용하는 경우 아래 가사보다 훨씬 더 많은 공백이 사용될 수 있습니다. Song Editor의 Menubar에 있는 Text Tools Menu에서 찾은 Fix Alignment Spaces를 사용하여 해당 코드를 원래 위치에 더 가깝게 가져온 다음 필요에 따라 수동으로 조정합니다.
압축된 코드
다른 문제는 코드 위의 줄에서 너무 가까이 있는 코드일 수 있습니다. 이는 코드가 원래 텍스트 상자에 배치되고 코드 위에 정렬된 경우 발생할 수 있습니다. Song Editor에서 이러한 코드를 해당 가사 위에 수동으로 정렬해야 합니다.
손상된 문자
암호화된 PDF 문서에서 텍스트를 추출하려고 하면 화면에 가득한 문자가 표시될 수 있습니다. 추출 프로세스를 되돌리거나 Song Editor에서 나가서 텍스트를 추출하는 다른 방법을 찾아야 합니다.
인식되지 않은 문자
OnSong이 문서에서 텍스트를 직접 추출할 수 없으면 문서를 OCR(광학 문자 인식)에 제출해야 할 수 있습니다. 이는 컴퓨터가 문서를 시각적으로 "읽으려고" 시도함을 의미합니다. PDF의 품질에 따라 이로 인해 잘못된 문자가 사용될 수 있습니다. 예를 들어, 문서에 플랫 기호가 있으면 소문자 "b"로 해석될 수 있으며, PDF가 스캔된 경우 흐린 텍스트로 인해 다른 문자가 표시될 수 있습니다. 문서를 검토하고 Song Editor에서 필요에 따라 수동으로 이러한 변경을 수행합니다.