인수로서의 비ASCII 문자

Question 1

이렇게 할 수는 있지만 꼭 해야 할지 모르겠습니다. :-)

여기에 이미지 설명을 입력하세요

\documentclass{article}
\usepackage[T1]{fontenc}
\usepackage[utf8]{inputenc}

%\newcommand\<[1]{\textbf{#1}}
\makeatletter
\def\<{\expandafter\zz}
\def\zz#1{%
   \ifx\UTFviii@two@octets#1% could be 3 or 4 octets, but not today
     \expandafter\zztwo
    \else
     \expandafter\zzone{#1}%
 \fi}
\def\zztwo#1#2{\zzone{\UTFviii@two@octets#1#2}}
\makeatother
\def\zzone#1{\textbf{#1}}

\begin{document}

f\<oo b\<ar b\<öll


f\<{o}o b\<ar b\<{ö}ll

\end{document}

Answer

이렇게 할 수는 있지만 꼭 해야 할지 모르겠습니다. :-)

여기에 이미지 설명을 입력하세요

\documentclass{article}
\usepackage[T1]{fontenc}
\usepackage[utf8]{inputenc}

%\newcommand\<[1]{\textbf{#1}}
\makeatletter
\def\<{\expandafter\zz}
\def\zz#1{%
   \ifx\UTFviii@two@octets#1% could be 3 or 4 octets, but not today
     \expandafter\zztwo
    \else
     \expandafter\zzone{#1}%
 \fi}
\def\zztwo#1#2{\zzone{\UTFviii@two@octets#1#2}}
\makeatother
\def\zzone#1{\textbf{#1}}

\begin{document}

f\<oo b\<ar b\<öll


f\<{o}o b\<ar b\<{ö}ll

\end{document}

Question 2

LaTeX가 아닌 답변에 대해 유감스럽게 생각합니다.~할 수 있다UTF-8 코드를 일반 8비트 pdftex의 하나의 토큰으로 처리하면 David와 egreg의 답변에 표시된 합병증을 피할 수 있습니다. UTF-8로 인코딩된 파일을 생성해 볼 수 있습니다.

\input lmfonts

\def\<#1{{\bf#1}}
f\<oo b\<öll €\<€ f\<{oö} f\< öo
\bye

로 처리합니다 pdftex -fmt csplain test.tex.

egreg의 이미지

설명: 형식은 csplain입력 프로세서 수준에서 UTF-8 코드를 해석하고 토큰 프로세서에 단일 토큰(바이트 또는 제어 시퀀스)으로 반환할 수 있는 pdfTeX의 encTeX 확장으로 생성됩니다. 로그로 돌아가서 \write원래 UTF-8 코드를 파일로 저장할 수 있습니다.

Answer

LaTeX가 아닌 답변에 대해 유감스럽게 생각합니다.~할 수 있다UTF-8 코드를 일반 8비트 pdftex의 하나의 토큰으로 처리하면 David와 egreg의 답변에 표시된 합병증을 피할 수 있습니다. UTF-8로 인코딩된 파일을 생성해 볼 수 있습니다.

\input lmfonts

\def\<#1{{\bf#1}}
f\<oo b\<öll €\<€ f\<{oö} f\< öo
\bye

로 처리합니다 pdftex -fmt csplain test.tex.

egreg의 이미지

설명: 형식은 csplain입력 프로세서 수준에서 UTF-8 코드를 해석하고 토큰 프로세서에 단일 토큰(바이트 또는 제어 시퀀스)으로 반환할 수 있는 pdfTeX의 encTeX 확장으로 생성됩니다. 로그로 돌아가서 \write원래 UTF-8 코드를 파일로 저장할 수 있습니다.

Question 3

3바이트 및 4바이트 UTF-8 문자의 경우도 포함하는 일반적인 답변입니다. \<ö또는 \<{ö}허용됩니다. 마지막 예와 같이 공백이 생기면 제거됩니다.

잘못된 입력을 포착하기 위해 제어 시퀀스에 대한 테스트를 추가해야 할 수도 있습니다. 문자나 {뒤에 만 있으면 \<안전합니다.

\documentclass{article}
\usepackage[T1]{fontenc}
\usepackage[utf8]{inputenc}
\usepackage{textcomp}
\usepackage{lmodern}

\usepackage{xparse,l3regex}

\ExplSyntaxOn
\NewDocumentCommand{\<}{}
 {
  \pst_boldify:
 }

\tl_new:N \l__pst_first_byte_tl
\cs_new_protected:Npn \pst_boldify:
 {
  \peek_catcode_ignore_spaces:NTF \c_group_begin_token
   {
    \textbf
   }
   {
    \pst_boldify_aux:N
   }
 }

\cs_new_protected:Npn \pst_boldify_aux:N #1
 {
  \tl_set:Nx \l__pst_first_byte_tl
   {
    \int_compare:nT { `#1 < 128 } { 0 }
    \int_to_bin:n { `#1 }
   }
  \regex_replace_once:nnN { 0[01]*\Z } { } \l__pst_first_byte_tl
  \str_case:on { \l__pst_first_byte_tl }
   {
    { }      { \textbf { #1 } }
    { 11 }   { \pst_do_bold:nn { #1 } }
    { 111 }  { \pst_do_bold:nnn { #1 } }
    { 1111 } { \pst_do_bold:nnnn { #1 } }
   }
 }
\cs_new_protected:Npn \pst_do_bold:nn #1 #2
 {
  \textbf{#1#2}
 }
\cs_new_protected:Npn \pst_do_bold:nnn #1 #2 #3
 {
  \textbf{#1#2#3}
 }
\cs_new_protected:Npn \pst_do_bold:nnnn #1 #2 #3 #4
 {
  \textbf{#1#2#3#4}
 }

\ExplSyntaxOff

\begin{document}
f\<oo b\<öll €\<€ f\<{oö} f\< öo
\end{document}

아이디어는 다음 토큰(공백을 제거한 후)이 중괄호이면 \textbf실행된다는 것입니다. 그렇지 않으면 다음 토큰을 검사하여 이진 형식의 문자 코드로 변환합니다. 우리가 관리해야 하는 UTF-8 문자가 1바이트, 2바이트, 3바이트 또는 4바이트인지 확인하기 위해 포함된 첫 번째 0부터 모든 것이 제거됩니다. 마지막으로 적절한 결정이 내려집니다.

여기에 이미지 설명을 입력하세요

정규식 대체 없이 산술 테스트를 수행할 수 있습니다. 그러면 의 정의는 다음 \pst_boldify_aux:N과 같아야 합니다.

\cs_new_protected:Npn \pst_boldify_aux:N #1
 {
  \int_compare:nTF { `#1<128 }
   {
    \textbf
   }
   {
    \int_compare:nTF { 192 <= `#1 < 224 }
     {
      \pst_do_bold:nn { #1 }
     }
     {
      \int_compare:nTF { 224 <= `#1 < 240 }
       {
        \pst_do_bold:nnn { #1 }
       }
       {
        \pst_do_bold:nnnn { #1 }
       }
     }
   }
 }

나머지는 그대로 유지합니다( l3regex더 이상 로딩이 필요하지 않다는 점 제외).

Answer

3바이트 및 4바이트 UTF-8 문자의 경우도 포함하는 일반적인 답변입니다. \<ö또는 \<{ö}허용됩니다. 마지막 예와 같이 공백이 생기면 제거됩니다.

잘못된 입력을 포착하기 위해 제어 시퀀스에 대한 테스트를 추가해야 할 수도 있습니다. 문자나 {뒤에 만 있으면 \<안전합니다.

\documentclass{article}
\usepackage[T1]{fontenc}
\usepackage[utf8]{inputenc}
\usepackage{textcomp}
\usepackage{lmodern}

\usepackage{xparse,l3regex}

\ExplSyntaxOn
\NewDocumentCommand{\<}{}
 {
  \pst_boldify:
 }

\tl_new:N \l__pst_first_byte_tl
\cs_new_protected:Npn \pst_boldify:
 {
  \peek_catcode_ignore_spaces:NTF \c_group_begin_token
   {
    \textbf
   }
   {
    \pst_boldify_aux:N
   }
 }

\cs_new_protected:Npn \pst_boldify_aux:N #1
 {
  \tl_set:Nx \l__pst_first_byte_tl
   {
    \int_compare:nT { `#1 < 128 } { 0 }
    \int_to_bin:n { `#1 }
   }
  \regex_replace_once:nnN { 0[01]*\Z } { } \l__pst_first_byte_tl
  \str_case:on { \l__pst_first_byte_tl }
   {
    { }      { \textbf { #1 } }
    { 11 }   { \pst_do_bold:nn { #1 } }
    { 111 }  { \pst_do_bold:nnn { #1 } }
    { 1111 } { \pst_do_bold:nnnn { #1 } }
   }
 }
\cs_new_protected:Npn \pst_do_bold:nn #1 #2
 {
  \textbf{#1#2}
 }
\cs_new_protected:Npn \pst_do_bold:nnn #1 #2 #3
 {
  \textbf{#1#2#3}
 }
\cs_new_protected:Npn \pst_do_bold:nnnn #1 #2 #3 #4
 {
  \textbf{#1#2#3#4}
 }

\ExplSyntaxOff

\begin{document}
f\<oo b\<öll €\<€ f\<{oö} f\< öo
\end{document}

아이디어는 다음 토큰(공백을 제거한 후)이 중괄호이면 \textbf실행된다는 것입니다. 그렇지 않으면 다음 토큰을 검사하여 이진 형식의 문자 코드로 변환합니다. 우리가 관리해야 하는 UTF-8 문자가 1바이트, 2바이트, 3바이트 또는 4바이트인지 확인하기 위해 포함된 첫 번째 0부터 모든 것이 제거됩니다. 마지막으로 적절한 결정이 내려집니다.

여기에 이미지 설명을 입력하세요

정규식 대체 없이 산술 테스트를 수행할 수 있습니다. 그러면 의 정의는 다음 \pst_boldify_aux:N과 같아야 합니다.

\cs_new_protected:Npn \pst_boldify_aux:N #1
 {
  \int_compare:nTF { `#1<128 }
   {
    \textbf
   }
   {
    \int_compare:nTF { 192 <= `#1 < 224 }
     {
      \pst_do_bold:nn { #1 }
     }
     {
      \int_compare:nTF { 224 <= `#1 < 240 }
       {
        \pst_do_bold:nnn { #1 }
       }
       {
        \pst_do_bold:nnnn { #1 }
       }
     }
   }
 }

나머지는 그대로 유지합니다( l3regex더 이상 로딩이 필요하지 않다는 점 제외).

인수로서의 비ASCII 문자

답변1

답변2

답변3

관련 정보