Namespaces
Variants

mbrtowc

From cppreference.net
헤더 파일에 정의됨 <wchar.h>
size_t mbrtowc ( wchar_t * pwc, const char * s, size_t n, mbstate_t * ps ) ;
(C95부터)
size_t mbrtowc ( wchar_t * restrict pwc, const char * restrict s, size_t n,
mbstate_t * restrict ps ) ;
(C99부터)

좁은 멀티바이트 문자를 와이드 문자 표현으로 변환합니다.

만약 s 가 null 포인터가 아니라면, 최대 n 바이트까지의 멀티바이트 문자 문자열을 검사하여(현재 멀티바이트 변환 상태 * ps 를 고려하며, s 가 가리키는 바이트부터 시작하여) 다음 멀티바이트 문자를 완성하는 데 필요한 바이트 수를 결정합니다(시프트 시퀀스 포함). 만약 함수가 s 에 있는 다음 멀티바이트 문자가 완전하고 유효하다고 판단하면, 이를 해당 와이드 문자로 변환하여 * pwc 에 저장합니다( pwc 가 null이 아닌 경우).

만약 s 가 널 포인터라면, n pwc 의 값은 무시되며 호출은 mbrtowc ( NULL , "" , 1 , ps ) 와 동일합니다.

생성된 와이드 문자가 널 문자인 경우, * ps 에 저장된 변환 상태는 초기 시프트 상태입니다.

환경 매크로 __STDC_ISO_10646__ 가 정의된 경우, wchar_t 타입의 값들은 유니코드 필수 문자 집합(일반적으로 UTF-32 인코딩)에 있는 문자들의 짧은 식별자와 동일합니다; 그렇지 않으면 구현에 따라 정의됩니다. 어떤 경우든, 이 함수가 사용하는 멀티바이트 문자 인코딩은 현재 활성화된 C 로캘에 의해 지정됩니다.

목차

매개변수

pwc - 결과 와이드 문자를 기록할 위치에 대한 포인터
s - 입력으로 사용되는 멀티바이트 문자 문자열에 대한 포인터
n - 검사 가능한 s 내 바이트 수의 제한
ps - 멀티바이트 문자 문자열을 해석할 때 사용되는 변환 상태에 대한 포인터

반환값

다음 중 먼저 적용되는 항목:

  • 0 s 에서 변환된 문자(그리고 null이 아닌 경우 pwc 에 저장된)가 null 문자인 경우
  • s 에서 성공적으로 변환된 멀티바이트 문자의 바이트 수 [ 1 ... n ]
  • ( size_t ) - 2 다음 n 바이트가 불완전하지만 지금까지 유효한 멀티바이트 문자를 구성하는 경우. * pwc 에는 아무것도 기록되지 않음.
  • ( size_t ) - 1 인코딩 오류가 발생하는 경우. *pwc 에는 아무것도 기록되지 않으며, EILSEQ 값이 errno 에 저장되고, * ps 의 값은 지정되지 않은 상태로 남음.

예제

#include <stdio.h>
#include <locale.h>
#include <string.h>
#include <wchar.h>
int main(void)
{
    setlocale(LC_ALL, "en_US.utf8");
    mbstate_t state;
    memset(&state, 0, sizeof state);
    char in[] = u8"z\u00df\u6c34\U0001F34C"; // or u8"zß水🍌"
    size_t in_sz = sizeof in / sizeof *in;
    printf("Processing %zu UTF-8 code units: [ ", in_sz);
    for(size_t n = 0; n < in_sz; ++n) printf("%#x ", (unsigned char)in[n]);
    puts("]");
    wchar_t out[in_sz];
    char *p_in = in, *end = in + in_sz;
    wchar_t *p_out = out;
    int rc;
    while((rc = mbrtowc(p_out, p_in, end - p_in, &state)) > 0)
    {
        p_in += rc;
        p_out += 1;
    }
    size_t out_sz = p_out - out + 1;
    printf("into %zu wchar_t units: [ ", out_sz);
    for(size_t x = 0; x < out_sz; ++x) printf("%#x ", out[x]);
    puts("]");
}

출력:

Processing 11 UTF-8 code units: [ 0x7a 0xc3 0x9f 0xe6 0xb0 0xb4 0xf0 0x9f 0x8d 0x8c 0 ]
into 5 wchar_t units: [ 0x7a 0xdf 0x6c34 0x1f34c 0 ]

참고문헌

  • C11 표준 (ISO/IEC 9899:2011):
  • 7.29.6.3.2 mbrtowc 함수 (p: 443)
  • C99 표준 (ISO/IEC 9899:1999):
  • 7.24.6.3.2 mbrtowc 함수 (p: 389)

참고 항목

다음 멀티바이트 문자를 와이드 문자로 변환
(함수)
상태 정보를 사용하여 와이드 문자를 멀티바이트 표현으로 변환
(함수)
C++ 문서 for mbrtowc