mbrtowc
|
헤더 파일에 정의됨
<wchar.h>
|
||
| (C95부터) | ||
| (C99부터) | ||
좁은 멀티바이트 문자를 와이드 문자 표현으로 변환합니다.
만약
s
가 null 포인터가 아니라면, 최대
n
바이트까지의 멀티바이트 문자 문자열을 검사하여(현재 멀티바이트 변환 상태
*
ps
를 고려하며,
s
가 가리키는 바이트부터 시작하여) 다음 멀티바이트 문자를 완성하는 데 필요한 바이트 수를 결정합니다(시프트 시퀀스 포함). 만약 함수가
s
에 있는 다음 멀티바이트 문자가 완전하고 유효하다고 판단하면, 이를 해당 와이드 문자로 변환하여
*
pwc
에 저장합니다(
pwc
가 null이 아닌 경우).
만약
s
가 널 포인터라면,
n
과
pwc
의 값은 무시되며 호출은
mbrtowc
(
NULL
,
""
,
1
, ps
)
와 동일합니다.
생성된 와이드 문자가 널 문자인 경우, * ps 에 저장된 변환 상태는 초기 시프트 상태입니다.
환경 매크로 __STDC_ISO_10646__ 가 정의된 경우, wchar_t 타입의 값들은 유니코드 필수 문자 집합(일반적으로 UTF-32 인코딩)에 있는 문자들의 짧은 식별자와 동일합니다; 그렇지 않으면 구현에 따라 정의됩니다. 어떤 경우든, 이 함수가 사용하는 멀티바이트 문자 인코딩은 현재 활성화된 C 로캘에 의해 지정됩니다.
목차 |
매개변수
| pwc | - | 결과 와이드 문자를 기록할 위치에 대한 포인터 |
| s | - | 입력으로 사용되는 멀티바이트 문자 문자열에 대한 포인터 |
| n | - | 검사 가능한 s 내 바이트 수의 제한 |
| ps | - | 멀티바이트 문자 문자열을 해석할 때 사용되는 변환 상태에 대한 포인터 |
반환값
다음 중 먼저 적용되는 항목:
-
0
s에서 변환된 문자(그리고 null이 아닌 경우 pwc 에 저장된)가 null 문자인 경우 -
s에서 성공적으로 변환된 멀티바이트 문자의 바이트 수 [ 1 ... n ] -
(
size_t
)
-
2
다음
n바이트가 불완전하지만 지금까지 유효한 멀티바이트 문자를 구성하는 경우. * pwc 에는 아무것도 기록되지 않음. -
(
size_t
)
-
1
인코딩 오류가 발생하는 경우.
*pwc에는 아무것도 기록되지 않으며, EILSEQ 값이 errno 에 저장되고, * ps 의 값은 지정되지 않은 상태로 남음.
예제
#include <stdio.h> #include <locale.h> #include <string.h> #include <wchar.h> int main(void) { setlocale(LC_ALL, "en_US.utf8"); mbstate_t state; memset(&state, 0, sizeof state); char in[] = u8"z\u00df\u6c34\U0001F34C"; // or u8"zß水🍌" size_t in_sz = sizeof in / sizeof *in; printf("Processing %zu UTF-8 code units: [ ", in_sz); for(size_t n = 0; n < in_sz; ++n) printf("%#x ", (unsigned char)in[n]); puts("]"); wchar_t out[in_sz]; char *p_in = in, *end = in + in_sz; wchar_t *p_out = out; int rc; while((rc = mbrtowc(p_out, p_in, end - p_in, &state)) > 0) { p_in += rc; p_out += 1; } size_t out_sz = p_out - out + 1; printf("into %zu wchar_t units: [ ", out_sz); for(size_t x = 0; x < out_sz; ++x) printf("%#x ", out[x]); puts("]"); }
출력:
Processing 11 UTF-8 code units: [ 0x7a 0xc3 0x9f 0xe6 0xb0 0xb4 0xf0 0x9f 0x8d 0x8c 0 ] into 5 wchar_t units: [ 0x7a 0xdf 0x6c34 0x1f34c 0 ]
참고문헌
- C11 표준 (ISO/IEC 9899:2011):
-
- 7.29.6.3.2 mbrtowc 함수 (p: 443)
- C99 표준 (ISO/IEC 9899:1999):
-
- 7.24.6.3.2 mbrtowc 함수 (p: 389)
참고 항목
|
다음 멀티바이트 문자를 와이드 문자로 변환
(함수) |
|
|
(C95)
(C11)
|
상태 정보를 사용하여 와이드 문자를 멀티바이트 표현으로 변환
(함수) |
|
C++ 문서
for
mbrtowc
|
|