Namespaces
Variants

mbtowc

From cppreference.net
헤더 파일에 정의됨 <stdlib.h>
int mbtowc ( wchar_t * pwc, const char * s, size_t n )
(C99 이전)
int mbtowc ( wchar_t * restrict pwc, const char * restrict s, size_t n )
(C99 이후)

s 가 가리키는 첫 번째 바이트부터 시작하는 멀티바이트 문자를 와이드 문자로 변환하며, pwc 가 null이 아닌 경우 변환된 문자를 * pwc 에 기록합니다.

만약 s 가 널 포인터인 경우, 전역 변환 상태를 재설정하고 시프트 시퀀스 사용 여부를 결정합니다.

목차

참고 사항

mbtowc 에 대한 각 호출은 내부 전역 변환 상태(이 함수만이 알고 있는 mbstate_t 타입의 정적 객체)를 갱신합니다. 멀티바이트 인코딩이 시프트 상태를 사용하는 경우, 역추적이나 다중 스캔을 피하기 위해 주의해야 합니다. 어떤 경우든 여러 스레드가 동기화 없이 mbtowc 를 호출해서는 안 됩니다: 대신 mbrtowc 를 사용할 수 있습니다.

매개변수

pwc - 출력용 와이드 문자에 대한 포인터
s - 멀티바이트 문자에 대한 포인터
n - 검사 가능한 s의 바이트 수 제한

반환값

만약 s 가 널 포인터가 아닌 경우, 멀티바이트 문자에 포함된 바이트 수를 반환하거나 - 1 를 반환합니다 - 만약 s 가 가리키는 첫 번째 바이트들이 유효한 멀티바이트 문자를 구성하지 않는 경우, 또는 0 를 반환합니다 - 만약 s 가 널 문자 ' \0 ' 를 가리키는 경우.

만약 s 가 널 포인터인 경우, 내부 변환 상태를 초기 시프트 상태를 나타내도록 재설정하고 현재 멀티바이트 인코딩이 상태 독립적(시퀀스 시프트를 사용하지 않음)이면 0 을 반환하고, 현재 멀티바이트 인코딩이 상태 의존적(시퀀스 시프트를 사용함)이면 0이 아닌 값을 반환합니다.

예제

#include <locale.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <wchar.h>
// 멀티바이트 문자열을 와이드 문자 표준 출력으로 출력
// wprintf(L"%s\n", ptr); 와 동일
void print_mb(const char* ptr)
{
    mbtowc(NULL, NULL, 0); // 변환 상태 초기화
    const char* end = ptr + strlen(ptr);
    int ret = 0;
    for (wchar_t wc; (ret = mbtowc(&wc, ptr, end - ptr)) > 0; ptr += ret)
        wprintf(L"%lc", wc);
    wprintf(L"\n");
}
int main(void)
{
    setlocale(LC_ALL, "en_US.utf8");
    // UTF-8 좁은 멀티바이트 인코딩
    print_mb("z\u00df\u6c34\U0001F34C"); // 또는 "zß水🍌"
}

출력:

zß水🍌

참고문헌

  • C23 표준 (ISO/IEC 9899:2024):
  • 7.24.7.2 mbtowc 함수 (p: TBD)
  • C17 표준 (ISO/IEC 9899:2018):
  • 7.22.7.2 mbtowc 함수 (p: 260)
  • C11 표준 (ISO/IEC 9899:2011):
  • 7.22.7.2 mbtowc 함수 (p: 358)
  • C99 표준 (ISO/IEC 9899:1999):
  • 7.20.7.2 mbtowc 함수 (p: 322)
  • C89/C90 표준 (ISO/IEC 9899:1990):
  • 4.10.7.2 mbtowc 함수

참고 항목

(C95)
주어진 상태에서 다음 멀티바이트 문자를 와이드 문자로 변환합니다
(함수)
다음 멀티바이트 문자의 바이트 수를 반환합니다
(함수)