Document \807 etc. in raw byte display
authorPaul Eggert <eggert@cs.ucla.edu>
Thu, 28 Apr 2022 17:51:01 +0000 (10:51 -0700)
committerPaul Eggert <eggert@cs.ucla.edu>
Thu, 28 Apr 2022 17:53:10 +0000 (10:53 -0700)
* doc/emacs/display.texi (Display Custom): Mention potential
confusion in raw byte display.

doc/emacs/display.texi

index 2ac0dca6223378256ec8b0a9e46d970dade84cba..7a6c7f391b9511f487551d4be22e417acc205083 100644 (file)
@@ -2097,3 +2097,14 @@ argument to suppress the effect of bold-face in this case.
 byte with a decimal value of 128 is displayed as @code{\200}.  To
 change display to the hexadecimal format of @code{\x80}, set the
 variable @code{display-raw-bytes-as-hex} to @code{t}.
+Care may be needed when interpreting a raw byte when copying
+text from a terminal containing an Emacs session, or when a terminal's
+@code{escape-glyph} face looks like the default face.  For example, by
+default Emacs displays the four characters @samp{\}, @samp{2},
+@samp{0}, @samp{0} with the same characters it displays a byte with
+decimal value 128.  The problem can be worse with hex displays, where
+the raw byte 128 followed by the character @samp{7} is displayed as
+@code{\x807}, which Emacs Lisp reads as the single character U+0807
+SAMARITAN LETTER IT; this confusion does not occur with the
+corresponding octal display @code{\2007} because octal escapes contain
+at most three digits.