문자 인코딩과 unicode. ASCII, euc-kr, unicode, utf-8

암호문

뉴스기사

ascii character set(7bit)

// null 문자 참고
string str = "Hello, world!";

new line, line break(LF, CR/LF)

line seporator

java

System.lineSeparator()

javascript

import os from 'os';
os.EOL

ISO-8859(8bit)

ISO/IEC 8859 언어
ISO/IEC 8859-1 서유럽 언어 (영어, 프랑스어, 독일어, 스페인어, 포르투갈어 등)
ISO/IEC 8859-2 동유럽 언어 (폴란드어, 체코어, 슬로바키아어, 슬로베니아어, 크로아티아어 등)
ISO/IEC 8859-3 말티제어, 에스토니아어, 라트비아어 등
ISO/IEC 8859-4 라트비아어, 리투아니아어, 에스토니아어 등
ISO/IEC 8859-5 키릴 문자를 사용하는 슬라브 언어 (러시아어, 불가리아어, 세르비아어, 우크라이나어 등)
ISO/IEC 8859-6 아랍어
ISO/IEC 8859-7 그리스어
ISO/IEC 8859-8 히브리어
ISO/IEC 8859-9 터키어
ISO/IEC 8859-10 스웨덴어, 노르웨이어, 핀란드어 등
ISO/IEC 8859-11 태국어
ISO/IEC 8859-13 바르만어, 라트비아어, 리투아니아어, 에스토니아어 등
ISO/IEC 8859-14 아일랜드어, 스코틀랜드 게일어, 웨일스어 등
ISO/IEC 8859-15 서유럽 언어 (ISO/IEC 8859-1에서 일부 문자를 수정)
ISO/IEC 8859-16 동유럽 언어 (폴란드어, 체코어, 슬로바키아어, 슬로베니아어, 크로아티아어 등)

http header

Content-Type: text/html; charset=ISO-8859-7

html meta

<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
<!-- 둘중하나 선택 -->
<meta charset="iso-8859-1">

참고) 엡시딕(EBCDIC) 8bit