CSV

#!if 넘어옴1 != null
'''TSV'''{{{#!if 넘어옴2 == null
{{{#!if 넘어옴1[넘어옴1.length - 1] >= 0xAC00 && 넘어옴1[넘어옴1.length - 1] <= 0xD7A3
{{{#!if ((넘어옴1[넘어옴1.length - 1] - 0xAC00) % 28) == 0
는}}}{{{#!if ((넘어옴1[넘어옴1.length - 1] - 0xAC00) % 28) != 0
은}}}}}}{{{#!if 넘어옴1[넘어옴1.length - 1] < 0xAC00 || 넘어옴1[넘어옴1.length - 1] > 0xD7A3
은(는)}}}}}}{{{#!if 넘어옴2 != null
, ''''''{{{#!if 넘어옴3 == null
{{{#!if 넘어옴2[넘어옴2.length - 1] >= 0xAC00 && 넘어옴2[넘어옴2.length - 1] <= 0xD7A3
{{{#!if ((넘어옴2[넘어옴2.length - 1] - 0xAC00) % 28) == 0
는}}}{{{#!if ((넘어옴2[넘어옴2.length - 1] - 0xAC00) % 28) != 0
은}}}}}}{{{#!if 넘어옴2[넘어옴2.length - 1] < 0xAC00 || 넘어옴2[넘어옴2.length - 1] > 0xD7A3
은(는)}}}}}}}}}{{{#!if 넘어옴3 != null
, ''''''{{{#!if 넘어옴4 == null
{{{#!if 넘어옴3[넘어옴3.length - 1] >= 0xAC00 && 넘어옴3[넘어옴3.length - 1] <= 0xD7A3
{{{#!if ((넘어옴3[넘어옴3.length - 1] - 0xAC00) % 28) == 0
는}}}{{{#!if ((넘어옴3[넘어옴3.length - 1] - 0xAC00) % 28) != 0
은}}}}}}{{{#!if 넘어옴3[넘어옴3.length - 1] < 0xAC00 || 넘어옴3[넘어옴3.length - 1] > 0xD7A3
은(는)}}}}}}}}}{{{#!if 넘어옴4 != null
, ''''''{{{#!if 넘어옴5 == null
{{{#!if 넘어옴4[넘어옴4.length - 1] >= 0xAC00 && 넘어옴4[넘어옴4.length - 1] <= 0xD7A3
{{{#!if ((넘어옴4[넘어옴4.length - 1] - 0xAC00) % 28) == 0
는}}}{{{#!if ((넘어옴4[넘어옴4.length - 1] - 0xAC00) % 28) != 0
은}}}}}}{{{#!if 넘어옴4[넘어옴4.length - 1] < 0xAC00 || 넘어옴4[넘어옴4.length - 1] > 0xD7A3
은(는)}}}}}}}}}{{{#!if 넘어옴5 != null
, ''''''{{{#!if 넘어옴6 == null
{{{#!if 넘어옴5[넘어옴5.length - 1] >= 0xAC00 && 넘어옴5[넘어옴5.length - 1] <= 0xD7A3
{{{#!if ((넘어옴5[넘어옴5.length - 1] - 0xAC00) % 28) == 0
는}}}{{{#!if ((넘어옴5[넘어옴5.length - 1] - 0xAC00) % 28) != 0
은}}}}}}{{{#!if 넘어옴5[넘어옴5.length - 1] < 0xAC00 || 넘어옴5[넘어옴5.length - 1] > 0xD7A3
은(는)}}}}}}}}}{{{#!if 넘어옴6 != null
, ''''''{{{#!if 넘어옴7 == null
{{{#!if 넘어옴6[넘어옴6.length - 1] >= 0xAC00 && 넘어옴6[넘어옴6.length - 1] <= 0xD7A3
{{{#!if ((넘어옴6[넘어옴6.length - 1] - 0xAC00) % 28) == 0
는}}}{{{#!if ((넘어옴6[넘어옴6.length - 1] - 0xAC00) % 28) != 0
은}}}}}}{{{#!if 넘어옴6[넘어옴6.length - 1] < 0xAC00 || 넘어옴6[넘어옴6.length - 1] > 0xD7A3
은(는)}}}}}}}}}{{{#!if 넘어옴7 != null
, ''''''{{{#!if 넘어옴8 == null
{{{#!if 넘어옴7[넘어옴7.length - 1] >= 0xAC00 && 넘어옴7[넘어옴7.length - 1] <= 0xD7A3
{{{#!if ((넘어옴7[넘어옴7.length - 1] - 0xAC00) % 28) == 0
는}}}{{{#!if ((넘어옴7[넘어옴7.length - 1] - 0xAC00) % 28) != 0
은}}}}}}{{{#!if 넘어옴7[넘어옴7.length - 1] < 0xAC00 || 넘어옴7[넘어옴7.length - 1] > 0xD7A3
은(는)}}}}}}}}}{{{#!if 넘어옴8 != null
, ''''''{{{#!if 넘어옴9 == null
{{{#!if 넘어옴8[넘어옴8.length - 1] >= 0xAC00 && 넘어옴8[넘어옴8.length - 1] <= 0xD7A3
{{{#!if ((넘어옴8[넘어옴8.length - 1] - 0xAC00) % 28) == 0
는}}}{{{#!if ((넘어옴8[넘어옴8.length - 1] - 0xAC00) % 28) != 0
은}}}}}}{{{#!if 넘어옴8[넘어옴8.length - 1] < 0xAC00 || 넘어옴8[넘어옴8.length - 1] > 0xD7A3
은(는)}}}}}}}}}{{{#!if 넘어옴9 != null
, ''''''{{{#!if 넘어옴10 == null
{{{#!if 넘어옴9[넘어옴9.length - 1] >= 0xAC00 && 넘어옴9[넘어옴9.length - 1] <= 0xD7A3
{{{#!if ((넘어옴9[넘어옴9.length - 1] - 0xAC00) % 28) == 0
는}}}{{{#!if ((넘어옴9[넘어옴9.length - 1] - 0xAC00) % 28) != 0
은}}}}}}{{{#!if 넘어옴9[넘어옴9.length - 1] < 0xAC00 || 넘어옴9[넘어옴9.length - 1] > 0xD7A3
은(는)}}}}}}}}}{{{#!if 넘어옴10 != null
, ''''''{{{#!if 넘어옴10[넘어옴10.length - 1] >= 0xAC00 && 넘어옴10[넘어옴10.length - 1] <= 0xD7A3
{{{#!if ((넘어옴10[넘어옴10.length - 1] - 0xAC00) % 28) == 0
는}}}{{{#!if ((넘어옴10[넘어옴10.length - 1] - 0xAC00) % 28) != 0
은}}}}}}{{{#!if 넘어옴10[넘어옴10.length - 1] < 0xAC00 || 넘어옴10[넘어옴10.length - 1] > 0xD7A3
은(는)}}}}}} 여기로 연결됩니다.

#!if 설명 == null && 리스트 == null
{{{#!if 설명1 == null
다른 뜻에 대한 내용은 아래 문서를}}}{{{#!if 설명1 != null
{{{#!html 경제학 용어}}}에 대한 내용은 [[공유 가치 창출]] 문서{{{#!if (문단1 == null) == (앵커1 == null)
를}}}{{{#!if 문단1 != null & 앵커1 == null
의 [[공유 가치 창출#s-|]]번 문단을}}}{{{#!if 문단1 == null & 앵커1 != null
의 [[공유 가치 창출#|]] 부분을}}}}}}{{{#!if 설명2 != null
, {{{#!html Closed System Vaporizor}}}에 대한 내용은 [[액상형 전자담배/기기]] 문서{{{#!if (문단2 == null) == (앵커2 == null)
를}}}{{{#!if 문단2 != null & 앵커2 == null
의 [[액상형 전자담배/기기#s-1.1|1.1]]번 문단을}}}{{{#!if 문단2 == null & 앵커2 != null
의 [[액상형 전자담배/기기#|]] 부분을}}}}}}{{{#!if 설명3 != null
, {{{#!html 독일의 스포츠 클럽}}}에 대한 내용은 [[TSV 그륀발트]] 문서{{{#!if (문단3 == null) == (앵커3 == null)
를}}}{{{#!if 문단3 != null & 앵커3 == null
의 [[TSV 그륀발트#s-|]]번 문단을}}}{{{#!if 문단3 == null & 앵커3 != null
의 [[TSV 그륀발트#|]] 부분을}}}}}}{{{#!if 설명4 != null
, {{{#!html 독일의 축구 팀}}}에 대한 내용은 [[TSV 슈타인바흐 하이거]] 문서{{{#!if (문단4 == null) == (앵커4 == null)
를}}}{{{#!if 문단4 != null & 앵커4 == null
의 [[TSV 슈타인바흐 하이거#s-|]]번 문단을}}}{{{#!if 문단4 == null & 앵커4 != null
의 [[TSV 슈타인바흐 하이거#|]] 부분을}}}}}}{{{#!if 설명5 != null
, {{{#!html 컴퓨터 시스템 밸리데이션을 의미하는 Computer System Validation의 두문자어}}}에 대한 내용은 [[밸리데이션]] 문서{{{#!if (문단5 == null) == (앵커5 == null)
를}}}{{{#!if 문단5 != null & 앵커5 == null
의 [[밸리데이션#s-|]]번 문단을}}}{{{#!if 문단5 == null & 앵커5 != null
의 [[밸리데이션#|]] 부분을}}}}}}{{{#!if 설명6 != null
, {{{#!html }}}에 대한 내용은 [[]] 문서{{{#!if (문단6 == null) == (앵커6 == null)
를}}}{{{#!if 문단6 != null & 앵커6 == null
의 [[#s-|]]번 문단을}}}{{{#!if 문단6 == null & 앵커6 != null
의 [[#|]] 부분을}}}}}}{{{#!if 설명7 != null
, {{{#!html }}}에 대한 내용은 [[]] 문서{{{#!if (문단7 == null) == (앵커7 == null)
를}}}{{{#!if 문단7 != null & 앵커7 == null
의 [[#s-|]]번 문단을}}}{{{#!if 문단7 == null & 앵커7 != null
의 [[#|]] 부분을}}}}}}{{{#!if 설명8 != null
, {{{#!html }}}에 대한 내용은 [[]] 문서{{{#!if (문단8 == null) == (앵커8 == null)
를}}}{{{#!if 문단8 != null & 앵커8 == null
의 [[#s-|]]번 문단을}}}{{{#!if 문단8 == null & 앵커8 != null
의 [[#|]] 부분을}}}}}}{{{#!if 설명9 != null
, {{{#!html }}}에 대한 내용은 [[]] 문서{{{#!if (문단9 == null) == (앵커9 == null)
를}}}{{{#!if 문단9 != null & 앵커9 == null
의 [[#s-|]]번 문단을}}}{{{#!if 문단9 == null & 앵커9 != null
의 [[#|]] 부분을}}}}}}{{{#!if 설명10 != null
, {{{#!html }}}에 대한 내용은 [[]] 문서{{{#!if (문단10 == null) == (앵커10 == null)
를}}}{{{#!if 문단10 != null & 앵커10 == null
의 [[#s-|]]번 문단을}}}{{{#!if 문단10 == null & 앵커10 != null
의 [[#|]] 부분을}}}}}}

#!if 설명 == null
{{{#!if 리스트 != null
다른 뜻에 대한 내용은 아래 문서를}}} 참고하십시오.

#!if 리스트 != null
{{{#!if 문서명1 != null
 * {{{#!if 설명1 != null
경제학 용어: }}}[[공유 가치 창출]] {{{#!if 문단1 != null & 앵커1 == null
문서의 [[공유 가치 창출#s-|]]번 문단}}}{{{#!if 문단1 == null & 앵커1 != null
문서의 [[공유 가치 창출#|]] 부분}}}}}}{{{#!if 문서명2 != null
 * {{{#!if 설명2 != null
Closed System Vaporizor: }}}[[액상형 전자담배/기기]] {{{#!if 문단2 != null & 앵커2 == null
문서의 [[액상형 전자담배/기기#s-1.1|1.1]]번 문단}}}{{{#!if 문단2 == null & 앵커2 != null
문서의 [[액상형 전자담배/기기#|]] 부분}}}}}}{{{#!if 문서명3 != null
 * {{{#!if 설명3 != null
독일의 스포츠 클럽: }}}[[TSV 그륀발트]] {{{#!if 문단3 != null & 앵커3 == null
문서의 [[TSV 그륀발트#s-|]]번 문단}}}{{{#!if 문단3 == null & 앵커3 != null
문서의 [[TSV 그륀발트#|]] 부분}}}}}}{{{#!if 문서명4 != null
 * {{{#!if 설명4 != null
독일의 축구 팀: }}}[[TSV 슈타인바흐 하이거]] {{{#!if 문단4 != null & 앵커4 == null
문서의 [[TSV 슈타인바흐 하이거#s-|]]번 문단}}}{{{#!if 문단4 == null & 앵커4 != null
문서의 [[TSV 슈타인바흐 하이거#|]] 부분}}}}}}{{{#!if 문서명5 != null
 * {{{#!if 설명5 != null
컴퓨터 시스템 밸리데이션을 의미하는 Computer System Validation의 두문자어: }}}[[밸리데이션]] {{{#!if 문단5 != null & 앵커5 == null
문서의 [[밸리데이션#s-|]]번 문단}}}{{{#!if 문단5 == null & 앵커5 != null
문서의 [[밸리데이션#|]] 부분}}}}}}{{{#!if 문서명6 != null
 * {{{#!if 설명6 != null
: }}}[[]] {{{#!if 문단6 != null & 앵커6 == null
문서의 [[#s-|]]번 문단}}}{{{#!if 문단6 == null & 앵커6 != null
문서의 [[#|]] 부분}}}}}}{{{#!if 문서명7 != null
 * {{{#!if 설명7 != null
: }}}[[]] {{{#!if 문단7 != null & 앵커7 == null
문서의 [[#s-|]]번 문단}}}{{{#!if 문단7 == null & 앵커7 != null
문서의 [[#|]] 부분}}}}}}{{{#!if 문서명8 != null
 * {{{#!if 설명8 != null
: }}}[[]] {{{#!if 문단8 != null & 앵커8 == null
문서의 [[#s-|]]번 문단}}}{{{#!if 문단8 == null & 앵커8 != null
문서의 [[#|]] 부분}}}}}}{{{#!if 문서명9 != null
 * {{{#!if 설명9 != null
: }}}[[]] {{{#!if 문단9 != null & 앵커9 == null
문서의 [[#s-|]]번 문단}}}{{{#!if 문단9 == null & 앵커9 != null
문서의 [[#|]] 부분}}}}}}{{{#!if 문서명10 != null
 * {{{#!if 설명10 != null
: }}}[[]] {{{#!if 문단10 != null & 앵커10 == null
문서의 [[#s-|]]번 문단}}}{{{#!if 문단10 == null & 앵커10 != null
문서의 [[#|]] 부분}}}}}}

<rowcolor=#ffffff,#dddddd> 데이터 직렬화 형식과 설정 파일
{{{#!wiki style="min-height: calc(1.5em + 5px); margin: 0 -10px -5px" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin: -5px -1px -11px"	<colbgcolor=#4d5767,#4d5767><colcolor=#ffffff,#dddddd> 데이터 직렬화 형식	<colbgcolor=#4d5767,#4d5767><colcolor=#ffffff,#dddddd> 텍스트	CSV · JSON(NDJSON/JSON Lines) · XML
바이너리		flatbuffers · protobuf
설정 파일	텍스트	JSON(YAML · JSON5 · JSONC) · XML · INI(dotenv · EditorConfig · TOML)	}}}}}}}}}

1. 개요2. 구조3. 특징4. 장단점

4.1. 장점4.2. 단점

5. 무결성 검증6. 다른 포맷과의 비교7. 관련 소프트웨어

7.1. 조작 소프트웨어7.2. 검증 소프트웨어

1. 개요

Comma Separated Values

표 형태(tabular)의 데이터를 저장하는 텍스트 파일 형식의 일종. 표 형식이라 함은 행(row)과 열(column) 2개의 축으로 이루어진 유형의 정보를 말하며, 쉽게 비유하면 스프레드시트를 생각할 수 있다.

주로 쓰이는 확장자는 .csv이며 MIME 형식은 text/csv이다. 전부 자음이라 한글로는 보이는 그대로 '시에스브이'라고 읽는다.

2. 구조

하나의 CSV 파일은 하나의 독립된 2차원 데이터를 나타낸다. 각 줄은 하나의 행(row)에 해당하고 각 열(column) 사이에는 쉼표(,)를 넣어 구분하며, 이때 모든 행은 같은 개수의 열을 가져야 한다. 줄 바꿈 문자는 라인 피드(LF, 이스케이프 문자로는 \\n) 또는 캐리지 리턴과 라인 피드(CRLF 병용)를 사용한다.

예시)
학생 기록부에 아래와 같은 표 데이터가 있다고 하자.

이름	생년	월	일	국어 점수	영어 점수	수학 점수
홍길동	1992년	7월	17일	100점	90점	70점
희동이	1992년	4월	3일	90점	100점	100점

위의 데이터를 CSV 형식으로 저장하면 아래와 같은 형태가 된다.

이름,생년,월,일,국어 점수,영어 점수,수학 점수
홍길동,1992년,7월,17일,100점,90점,70점
희동이,1992년,4월,3일,90점,100점,100점

3. 특징

사실 CSV라는 포맷은 표준적으로 정의된 스키마(schema)나 데이터 타입이 있는 게 아니다. 구분자를 뭘로 쓰든 데이터를 주고받는 사이에 약속만 지키면 된다. 단지 주로 쓰는 구분자가 콤마일 뿐.

CSV에서 사용하는 특수 문자는 필드 구분자와 레코드 구분자 둘뿐이고 인용이나 이스케이프 문자는 선택 사양이다. 일반적으로 데이터 생산자가 CSV 데이터의 성격을 보고 필드 안에 들어갈 확률이 가장 적은 문자를 필드 구분자로 정한다. 레코드 구분자 역시 필드에 줄 바꿈이 자주 쓰일 경우 라인 피드 대신 널 문자(NULL)를 쓰기도 한다. 하지만 레코드 구분자에 손대면 표준 텍스트 에디터로 내용 확인이 거의 불가능해지기 때문에 필드에 줄 바꿈 문자가 자주 등장할 경우 CSV 말고 다른 포맷을 고려한다.

4. 장단점

4.1. 장점

표의 형태를 직관적으로 나타내는 간단한 형식이라 이해하기 쉬우며[1], 다른 복잡한 포맷에 비해 CSV는 별다른 파서/인코더가 필요 없이 기초적인 문자열 조립만으로 읽거나 쓸 수 있기 때문에 소프트웨어로 처리하는 것도 쉽다. 텍스트 기반 형식이라 사람이 직접 읽고 수정하는 것도 가능하다. XML과 같은 다른 텍스트 기반 형식에 비해 거의 최소에 가까울 만큼 간결해서 차지하는 용량도 적다. 용량이 적을수록 대용량의 데이터[2]를 다루거나 웹 요청 등으로 보내기 유리해지며[3] 단순하고 간단한 포맷이라 범용성도 뛰어나서, 대부분의 스프레드시트 소프트웨어 중 CSV를 지원하지 않는 경우가 드물 정도이며 뛰어난 범용성 때문에 한쪽에서 다른 소프트웨어로 데이터를 옮기기도 편리하다. 이런 표현이 익숙하지 않은 사람들을 위해, CSV를 표 기반으로 바꿔서 보여주는 툴도 다른 포맷들에 비해 많은 편이다.

4.2. 단점

단점은 데이터에 쉼표가 포함된 내용을 취급하기 곤란하다는 것. 예를 들어 천 단위마다 쉼표를 찍어 놓은 금액 데이터(100,000)를 CSV에 직접 집어넣으면 나중에 해석할 때 서로 다른 열로 취급되므로 문제가 된다.

해결책은 쉼표가 포함된 문자열을 따옴표로 감싼다.[4]

쉼표 대신 다른 특수 문자를 구분자로 쓰는 방법도 있다. 주로 탭 문자(\t)를 구분자로 사용하는데 아예 Tab-Separated Values(TSV)라고 따로 부른다.

문자열을 URL escape code로 인코딩해서 콤마를 제거하는 방법도 존재한다. 다만 이 경우 데이터를 받는 사람이 그 사실을 모르면 해석에 문제가 생길 수 있다.

간혹 텍스트 편집기를 사용한 정규 표현식 전처리가 고려되기도 한다.

5. 무결성 검증

일반적으로 CSV 파일의 무결성을 검증할 때는 한 줄의 콤마 수를 센다. 모든 줄의 콤마 수는 다 같아야 하며 더 적거나 더 많은 줄이 발견되면 오류로 판단해 걸러내는 등의 적절한 처리를 할 필요가 있다. 가장 일반적으로 발견되는 오류는 다음과 같다.

내용에 콤마가 들어가서 한 줄의 콤마 수가 몇 개 늘어나는 경우
줄 바꿈 문자가 누락돼 한 줄의 콤마 수가 두 배로 늘어나는 경우
내용에 줄 바꿈 문자가 들어가서 두 줄 이상의 콤마 수가 정상보다 적은 경우
줄 바꿈 문자의 캐리지 리턴(CR)을 걸러내지 못해 마지막 필드의 데이터가 깨지는 경우
따옴표가 정상적으로 닫히지 않아 임의의 필드와 레코드가 한 필드 안에 인용돼 들어간 경우
마지막 줄의 라인 피드 누락으로 마지막 줄 데이터를 읽지 못한 경우
첫 줄에 헤더 텍스트가 들어간 CSV를 사용할 때 첫 줄을 건너뛰지 않은 경우

최악은 CSV의 필드 안에 게시판 본문 데이터를 그냥 담는 것이다. 게시글 본문에는 쉼표, 따옴표, 줄 바꿈 문자가 모두 들어가기 때문에 데이터가 어떻게 깨졌는지, 심지어는 이게 깨진 레코드인지조차 모를 수도 있다. 예를 들어 게시글 본문 내용 자체가 CSV 데이터일 경우 존재하지도 않는 유령 게시글이 하나 등록될 수 있다. ~~CSV 인젝션~~ 이 경우에는 아예 CSV 자체를 안 쓰는 게 정신 건강에 좋다. 참고로 게시판 본문 데이터가 HTML일 경우가 끝판왕으로 XML을 써도 힘들다.[5][6]

테이블 덤프 등의 이유로 무조건 CSV를 써야 한다면 아예 게시판 본문 데이터 전체를 URI Encode하고 무조건 따옴표로 인용하면 데이터 크기가 커지고 편집기로 직접 못 읽지만 어쨌든 문제를 회피할 수 있다. 자바스크립트 사용자라면 encodeURI()가 아닌 encodeURIComponent() 함수를 써야 제대로 이스케이프 처리 된다.

6. 다른 포맷과의 비교

보다시피 데이터 오염에 대단히 취약한 포맷이다 보니 본격적인 데이터 교환 포맷으로는 XML과 JSON을 쓴다. 둘 중 XML이 상대적으로 데이터 오염에 더 잘 견딘다. 하지만 CSV는 현재도 IT 및 산업계에서 널리 사용 중인데 가장 결정적인 이유는 데이터의 크기가 작기 때문이다. JSON만 돼도 CSV 대비 2배에서 3배 이상 데이터의 크기가 커지기 일쑤인 데다 CSV 파서(parser)는 대단히 간단해서 인용 및 이스케이프 처리를 하지 않는 CSV 파서는 대부분의 프로그래밍 언어에서 코드 한 줄로 가능하다. 게다가 파일 일부에 문제가 생겨도 CSV의 오류는 보통 레코드 단위로 재동기화가 가능하다. JSON은 따옴표나 중괄호 같은 게 하나라도 누락되면 전체 JSON 파일의 로드에 실패하는 치명적인 문제가 있다. XML의 경우에는 보통 문제가 생긴 엘리먼트의 부모 엘리먼트에까지만 오류가 전파되므로 CSV보다 더 강한 내결함성이 있지만 JSON보다도 더 데이터의 크기가 커져버린다. 만약 로드하려는 데이터가 기가바이트 단위를 바라본다면 몇 퍼센트의 데이터 오버헤드도 무시할 수 없는 문제가 되는데 이런 분야에서 CSV가 활약하는 것이다. 덤으로 CSV는 압축도 잘되고 스트림 압축이 가능해서 데이터의 일부만 수신된 상태에서도 데이터 적재 작업을 시작할 수 있다.[7]

한 가지 팁으로 대용량의 CSV 파일은 리눅스에서는 split 유틸리티를 사용해서 원하는 크기로 분할 가능하고, cat 명령어 또는 copy /b 명령어로 다시 합칠 수 있다. 실무에서는 용량이 큰 CSV 처리는 DB에서 보다 안정적으로 처리할 수 있기 때문에 DB로 변환하기도 하며, SQL DBMS에서도 명령어 한 줄로 CSV to Table을 지원한다.

7. 관련 소프트웨어

데이터 직렬화 형식인 만큼 특정 비즈니스(business-specific) 데이터의 입/출력의 방식 중 하나로 지원하는 경우가 많다. 가령 Microsoft Excel 형식의 원본 데이터를 CSV 형식으로 내보내도록 지원하는 식.

7.1. 조작 소프트웨어

CSV의 데이터 조작(manipulation) 및 쿼리에 특화된 소프트웨어만을 나열한다. 형식이 형식이다 보니 SQL과 비슷한 기능과 동작을 가지기도 하는 편.

xsv - 현재 개발이 중단되었다.
qsv
xan - 데이터 시각화에 특화되어 있다. 히트맵, plotting 등 기능을 내장으로 지원할 정도.

7.2. 검증 소프트웨어

csvlint - 린터

[1] 다만 너무나도 단순무식한 포멧이라 양이 많아지면 인간이 이해하기 힘들어진다. 100열 100행의 표를 저렇게 나타내면 어지러울 수밖에 없다.[2] 특히 IT 기술 중에서도 압도적으로 대규모의 데이터가 오가는 머신 러닝 등에 자주 사용되는데, 대용량의 시계열 데이터를 CSV로 주고받거나, 비트맵 이미지를 학습 전 미리 인코딩을 풀어 놓는 전처리 과정을 거치는데, 이때 BMP도 사용되지만 더 극단적인 경우(예를 들어 색상 정보를 지우고 모노 채널로만 학습하는 경우) 이미지를 그대로 CSV로 변환하기도 한다.[3] 그러나 단점 때문에 웹 API는 대부분 JSON을 사용한다.[4] 이때 따옴표도 이스케이프하려면 따옴표를 두 번 쓰거나, 따옴표 앞에 \를 쓰면 된다.[5] CDATA로 이스케이핑한다. 본문 내에 CDATA를 쓴 경우에는 필터로 날려버리거나 HTML 엔티티로 이스케이프하고 저장한다.[6] 모든 텍스트 기반 자료 구조를 다룰 때는 해당 자료 구조의 필드에 '자기 자신의 데이터'를 담는 경우를 염두에 둬야 한다. 아예 처음부터 입력을 막거나 또는 이스케이프 방법을 제공해야만 한다. 바이너리 기반 자료 구조는 보통 데이터 필드의 정확한 길이를 해당 필드를 읽기 전에 알 수 있도록 배려하기 때문에 이런 문제가 덜하다.[7] XML도 SAX 파서 사용시 스트림 전송이 가능하다.

CSV