최근 수정 시각 : 2025-03-20 17:32:24

BOM

1. 개요2. Byte Order Mark3. Browser Object Model4. Bill Of Material5. Boys Of MNH

1. 개요

단어 또는 약어가 BOM 인 것들을 다루는 문서

2. Byte Order Mark

바이트 순서 마크(표식). BOM.

유니코드 문자 U+FEFF를 쓴다. 인코딩 방식에 따라서 FF FE로 표기하기도 하나, 실제로 해석할 때에는 U+FEFF로 읽는다. 그리고 U+FFFE[1]에는 문자가 처음부터 배당되지 않았기에, U+FFFE가 실제로 쓰일 일은 없어서 U+FEFF가 U+FFFE와 혼동될 여지가 앞으로도 없다.

정식 이름은 ZERO WIDTH NO-BREAK SPACE이다. 공백의 일종이지만 원래 용도 대신 BOM으로 쓰며, zero width non-breaking space의 역할은 U+2060인 WORD JOINER가 대신한다.

좀 뜬금없지만 유니코드에서 BOM이 포함된 블럭은 아랍 문자용 블럭인 Arabic Presentation Forms-B이다. 당연하지만 BOM은 아랍 문자와는 아무런 상관이 없다.

이 문자는 보통 UTF-16으로 된 파일의 엔디언이 올바르게 판단될 수 있도록 하기 위해서 파일의 맨 앞에 삽입된다. 실제로 UTF-16의 처리 방식은 순서에 따라 빅 엔디언(big endian, BE)과 리틀 엔디언(little endian, LE) 2가지가 있다. 두 방식 다 나름의 장점이 있기 때문에 아직도 둘 다 쓴다. CPU의 데이터 처리 방식이 빅 엔디언인 것도 있고 리틀 엔디언인 것도 있어서 CPU에 맞게 처리하는 것이 좀 더 자연스럽기도 하고.

UTF-8은 엔디언 문제가 없기 때문에 BOM이 필요하지 않다. 유니코드 표준에 의하면 UTF-8 파일에 BOM을 쓰는 것이 허용되기는 하지만, 쓰지 않을 것을 권장한다.

일부 프로그램에서는 UTF-8 방식으로 인코딩된 EF BB BF BOM을 이용하여 UTF-8인지를 감지하기도 한다. 이것이 없으면 기존의 완성형(및 각 언어별 코드페이지) 형식 문서로 간주하는 것. 파일의 내용을 통해 UTF-8 인코딩인지 아닌지를 감지할 수도 있지만 잘못 감지하는 경우도 있고, BOM만으로 감지하는 프로그램도 있다 보니 UTF-8 문서에도 BOM을 넣어두는게 편한 게 사실이다. Windows 쪽 에디터 프로그램들은 BOM이 없으면 UTF-8이라는 것을 인식하지 못하는 경우가 종종 발생한다. Visual Studio에서는 소스 파일의 인코딩을 UTF-8 BOM으로 설정하면 한글이 정상 출력되지만, UTF-8으로 설정하면 파일을 ANSI로 인식해 에디터와 콘솔에서 한글이 전부 깨진 채로 나온다.

그런데 일부 프로그램에서는 UTF-8로 저장할 때 자동으로 BOM을 넣기도 한다. 대표적으로 BOM을 자동 삽입하는 텍스트 에디터가 Microsoft Windows의 보조 프로그램인 메모장이다. 다만 Windows 10 1903부터 기본 인코딩이 기존의 ANSI(=MBCS)에서 BOM 없는 UTF-8으로 바뀌었으며, 저장 시에 BOM을 붙일지 선택할 수 있게 바뀌었다.

거꾸로 BOM이 문제를 일으키기도 한다. UTF-8이 거의 기본으로 쓰이는 유닉스 계열 OS에서 이런 문제가 많은 편인데, PHP의 경우 읽어들이는 내용이 PHP 소스로 되어 있으면 PHP로 실행하기 시작하고, 일반 텍스트로 되어 있으면 텍스트로 읽어들이기 시작하는데 PHP는 BOM을 인식하지 못한다. 그래서 일반 텍스트로 알고 보냈는데 하필 BOM으로 시작하는 바람에, PHP가 시작되니 오작동을 일으키는 것. 유닉스 계통 컴파일러(GCC, LLVM/Clang 등)에서도 UTF-8에 BOM을 붙여 저장한 파일의 경우 BOM의 존재로 인하여 오작동을 일으킬 수도 있다. 이외에 텍스트 파일을 합칠 때 애로사항이 생길 수 있는 등, 개발자 입장에서는 BOM을 자동으로 넣어주는 프로그램이 오히려 욕먹는다. 이런 경우 저장 시 BOM을 추가할지 말지 선택할 수 있는 에디터 또는 IDE로 문서를 저장해야 한다. Notepad++, IntelliJ IDEA, Visual Studio Code, EditPlus 등의 개발 툴은 UTF-8에 BOM을 추가할지 여부를 선택할 수 있다.

3. Browser Object Model

자바스크립트에서 브라우저 관련 기능을 조작할 수 있게 만든 객체 모델. window라는 객체로 접근하여 사용할 수 있다.

4. Bill Of Material

자재명세서. 구매해야될 부품 등을 하나로 모아놓은 주문 명세서.

제품을 제작할 때 들어가는 부품에 대해서 전부 표시해 놓으며 이들 부품의 사양에 대해서 적혀 있어 한꺼번에 주문할 때 사용하며 주로 적혀있는 내용은 부품번호, 부품명, 부품수량, 상세사양, 공차 등이다. 주로 부품공급사에 부품을 주문할 때나 턴키제작을 할 때 사용된다.

5. Boys Of MNH

MNH엔터테인먼트에서 런칭한 첫번째 보이그룹으로, Boys Of MNH를 줄인 BOM이라는 이름으로 공개되었다가 2023년 1월 8TURN이라는 팀명으로 데뷔했다.


[1] U+FFFE - U+FFFF 영역은 비문자(Noncharacter)로 지정되어 영구적으로 어떠한 문자도 배당되지 않는다.