среда, 29 апреля 2009 г.

cl-pdf и кирилица в структуре документа

PDF как формат я полюбил ещё до знакомства с lisp, ну а после перехода на CL открыл для себя замечательную библиотеку cl-pdf. Библиотека и правда замечательная, но с самого начала у меня не получалось с её помощью создавать структуру документа (закладки), содержащую русские названия. Тогда в CL я разбирался ещё совсем плохо и поэтому на проблему просто забил. Но вот теперь захотелось для одного генерируемого документа сделать всё красиво, ибо он большой и нужны нормальные средства навигации. Начал разбираться и нашёл проблему в функции pdf-string, причём, видимо, эта проблема проявляется только в sbcl: код этой фукнции подразумевает, что, например, (code-char 254) имеет тип base-char, но в sbcl это extended-char. В итоге родился небольшой патч, решающий эту проблему:
diff --git a/pdf.lisp b/pdf.lisp
index 16d8f6f..b54b5a6 100644
--- a/pdf.lisp
+++ b/pdf.lisp
@@ -235,21 +235,20 @@
(setq unicode (notevery #+lispworks #'lw:base-char-p
#-lispworks (lambda (char) (<= (char-code char) 255))
string)))
- (with-output-to-string (stream nil :element-type 'base-char)
- (write-char #\( stream)
- (when unicode ; write the Unicode byte order marker U+FEFF
- (write-char #.(code-char 254) stream) (write-char #.(code-char 255) stream))
+ (with-output-to-string (stream nil :element-type 'base-char)
+ (if unicode
+ (write-string "<FEFF" stream)
+ (write-char #\( stream))
(loop for char across string
for code = (char-code char)
if unicode
- do (write-char (code-char (ldb (byte 8 8) code)) stream) ; hi
- (write-char (code-char (ldb (byte 8 0) code)) stream) ; lo
+ do (format stream "~4,'0x" code)
else if (> code 255)
do (write-char (code-char (ldb (byte 8 0) code)) stream) ; lo
else do (case char ((#\( #\) #\\)
(write-char #\\ stream)))
(write-char char stream))
- (write-char #\) stream))))
+ (write-char (if unicode #\> #\)) stream))))

(defmacro with-outline-level ((title ref-name) &body body)
`(unwind-protect

Комментариев нет:

Отправить комментарий