std:: scanf, std:: fscanf, std:: sscanf

From cppreference.net

헤더 파일에 정의됨 `<cstdio>`
int scanf ( const char * format, ... ) ;	(1)
int fscanf ( std:: FILE * stream, const char * format, ... ) ;	(2)
int sscanf ( const char * buffer, const char * format, ... ) ;	(3)

다양한 소스에서 데이터를 읽어와서 format 에 따라 해석하고 결과를 지정된 위치에 저장합니다.

1) 데이터를 stdin 에서 읽어옵니다.

2) 파일 스트림 stream 에서 데이터를 읽습니다.

3) 널 종료 문자 배열 buffer 에서 데이터를 읽습니다.

공백이 아닌 멀티바이트 문자들 중 % 를 제외한 문자: 형식 문자열 내의 각 해당 문자는 입력 스트림에서 정확히 하나의 동일한 문자를 소비하거나, 스트림의 다음 문자가 동일하지 않을 경우 함수가 실패하게 합니다.
공백 문자: 형식 문자열 내의 단일 공백 문자는 입력에서 사용 가능한 모든 연속적인 공백 문자들을 소비합니다(루프에서 std::isspace 를 호출하는 것처럼 결정됨). 형식 문자열에서 " \n " , " " , " \t \t " , 또는 다른 공백 사이에는 차이가 없습니다.
변환 지정자. 각 변환 지정자는 다음 형식을 가집니다:

서론 % 문자.

(선택적) 할당 억제 문자 * . 이 옵션이 존재하면, 함수는 변환 결과를 어떤 수신 인자에도 할당하지 않습니다.

(선택 사항) 0보다 큰 정수로, 현재 변환 지정자에 의해 지정된 변환을 수행할 때 함수가 소비할 수 있는 최대 문자 수인 최대 필드 너비 를 지정합니다. % s 및 % [ 의 경우 너비가 제공되지 않으면 버퍼 오버플로가 발생할 수 있습니다.

(optional) length modifier 수신 인수의 크기, 즉 실제 대상 유형을 지정합니다. 이것은 변환 정확도와 오버플로 규칙에 영향을 미칩니다. 기본 대상 유형은 각 변환 유형에 따라 다릅니다(아래 표 참조).

변환 형식 지정자.

다음 형식 지정자를 사용할 수 있습니다:

변환 지정자	설명	예상 인수 타입
길이 수정자→		`hh`	`h`	없음	`l`	`ll`	`j`	`z`	`t`	`L`
C++11부터만 사용 가능→		Yes				Yes	Yes	Yes	Yes
`%`	리터럴 `%` 와 일치합니다.	N/A	N/A	N/A	N/A	N/A	N/A	N/A	N/A	N/A
`c`	문자 또는 문자 시퀀스 와 매치됩니다. 너비 지정자가 사용된 경우, 정확히 width 개의 문자와 매치됩니다 (인자는 충분한 공간을 가진 배열에 대한 포인터여야 합니다). %s 및 %[와 달리 배열에 널 문자를 추가하지 않습니다.	N/A	N/A	char *	wchar_t *	N/A	N/A	N/A	N/A	N/A
`s`	공백이 아닌 문자들의 시퀀스(즉, 문자열 )와 매칭됩니다. 너비 지정자가 사용된 경우, width 까지 또는 첫 번째 공백 문자가 나타날 때까지 중 먼저 도달하는 지점까지 매칭합니다. 항상 매칭된 문자들에 추가로 널 문자를 저장합니다(따라서 인자 배열은 최소 width+1 개의 문자를 수용할 수 있는 공간이 있어야 합니다).
`[` set `]`	set 에 포함된 문자들로 이루어진 비어 있지 않은 문자 시퀀스와 매치됩니다. 집합의 첫 번째 문자가 `^` 인 경우, 집합에 포함되지 않은 모든 문자가 매치됩니다. 집합이 `]` 또는 `^]` 로 시작하는 경우 `]` 문자도 집합에 포함됩니다. 스캔셋에서 처음 위치가 아닌 곳에 있는 `-` 문자가 `[0-9]` 와 같이 범위를 나타낼 수 있는지는 구현에 따라 정의됩니다. 너비 지정자가 사용된 경우, 최대 width 까지만 매치됩니다. 매치된 문자들에 추가로 항상 널 문자를 저장합니다 (따라서 인수 배열은 최소 width+1 개의 문자를 수용할 수 있는 공간이 있어야 합니다).
`d`	10진수 정수 와 매칭됩니다. 숫자의 형식은 std::strtol 함수에서 base 인수 값으로 10 을 사용할 때 예상되는 형식과 동일합니다.	signed char * 또는 unsigned char *	signed short * 또는 unsigned short *	signed int * 또는 unsigned int *	signed long * 또는 unsigned long *	signed long long * 또는 unsigned long long *	std:: intmax_t * 또는 std:: uintmax_t *	std:: size_t *	std:: ptrdiff_t *	해당 없음
`i`	정수 와 매칭됩니다. 숫자의 형식은 std::strtol 에서 0 값을 base 인수로 사용할 때 예상되는 형식과 동일합니다 (진법은 파싱된 첫 번째 문자들에 의해 결정됩니다).
`u`	부호 없는 10진수 정수 와 매칭됩니다. 숫자의 형식은 std::strtoul 함수가 10 값을 base 인수로 기대하는 형식과 동일합니다.
`o`	부호 없는 8진수 정수 와 매칭됩니다. 숫자의 형식은 std::strtoul 함수에서 8 값을 base 인수로 사용할 때 예상되는 형식과 동일합니다.
`x` `X`	부호 없는 16진수 정수 와 매칭됩니다. 숫자의 형식은 std::strtoul 함수에서 16 값을 base 인수로 사용할 때 예상되는 형식과 동일합니다.
`n`	지금까지 읽은 문자 수 를 반환합니다. 입력을 소비하지 않습니다. 할당 횟수를 증가시키지 않습니다. 지정자에 할당 억제 연산자가 정의된 경우, 동작은 정의되지 않습니다.
`a` (C++11) `A` (C++11) `e` `E` `f` `F` (C++11) `g` `G`	부동소수점 숫자 와 매칭됩니다. 숫자의 형식은 std::strtof 함수가 기대하는 형식과 동일합니다.	해당 없음	해당 없음	float *	double *	해당 없음	해당 없음	해당 없음	해당 없음	long double *
`p`	구현 정의된 문자 시퀀스를 매치하며, 이는 포인터 를 정의합니다. `printf` 함수군은 `%p` 형식 지정자를 사용하여 동일한 시퀀스를 생성해야 합니다.	N/A	N/A	void **	N/A	N/A	N/A	N/A	N/A	N/A
참고 사항
n 변환 지정자를 제외한 모든 변환 지정자에 대해, 지정된 필드 너비를 초과하지 않으면서 변환 지정자가 기대하는 시퀀스와 정확히 일치하거나 그 시퀀스의 접두사인 입력 문자들의 가장 긴 시퀀스가 스트림에서 소비됩니다. 이렇게 소비된 시퀀스 이후의 첫 번째 문자(있는 경우)는 읽히지 않은 상태로 남습니다. 소비된 시퀀스의 길이가 0이거나 소비된 시퀀스가 위에서 명시된 대로 변환될 수 없는 경우, 매칭 실패가 발생합니다. 단, 스트림에서의 입력이 파일 끝, 인코딩 오류 또는 읽기 오류로 인해 방해받은 경우는 입력 실패입니다. [ , c , 및 n 을 제외한 모든 변환 지정자는 입력을 구문 분석하기 전에 모든 선행 공백 문자들( std::isspace 를 호출하는 것처럼 결정됨)을 소비하고 버립니다. 이러한 소비된 문자들은 지정된 최대 필드 너비에 포함되지 않습니다. 변환 지정자 lc , ls , 및 l [ 는 첫 번째 문자가 변환되기 전에 0으로 초기화된 std::mbstate_t 객체를 사용하여 std::mbrtowc 를 호출하는 것처럼 멀티바이트-와이드 문자 변환을 수행합니다. 변환 지정자 s 와 [ 는 항상 매칭된 문자들에 추가로 널 종결 문자를 저장합니다. 대상 배열의 크기는 지정된 필드 너비보다 최소한 하나 더 커야 합니다. 대상 배열 크기를 지정하지 않고 % s 또는 % [ 를 사용하는 것은 std::gets 와 마찬가지로 안전하지 않습니다. 고정 너비 정수 타입 ( std::int8_t 등)에 대한 올바른 변환 지정자는 헤더 `<cinttypes>` 에 정의되어 있습니다(비록 `SCNdMAX` , `SCNuMAX` 등이 % jd , % ju 등과 동의어이지만). 각 변환 지정자의 동작 이후에는 시퀀스 포인트 가 있습니다; 이는 여러 필드를 같은 "싱크" 변수에 저장할 수 있게 합니다. 지수 부분에 숫자가 없이 끝나는 불완전한 부동 소수점 값을 파싱할 때, 예를 들어 변환 지정자 % f 로 "100er" 를 파싱하는 경우, "100e" (유효한 부동 소수점 숫자의 가능한 가장 긴 접두사) 시퀀스가 소비되어, 매칭 오류(소비된 시퀀스를 부동 소수점 숫자로 변환할 수 없음)가 발생하고, "r" 가 남습니다. 일부 기존 구현체는 이 규칙을 따르지 않고 "100" 만 소비하도록 롤백하여 "er" 를 남깁니다(예: glibc 버그 1765 ). 변환 명세가 유효하지 않은 경우, 동작은 정의되지 않습니다.

반환값

성공적으로 할당된 수신 인수의 개수(첫 번째 수신 인수가 할당되기 전에 일치 실패가 발생한 경우 0일 수 있음), 또는 EOF 첫 번째 수신 인수가 할당되기 전에 입력 실패가 발생한 경우.

복잡도

보장되지 않습니다. 특히 일부 구현에서는 std::sscanf 가 $O(N)$ 인 경우가 있으며, 여기서 N = std:: strlen ( buffer ) [1] 입니다. 고성능 문자열 파싱을 위해서는 std::from_chars 를 참조하십시오.

참고 사항

대부분의 변환 지정자는 먼저 연속된 모든 공백을 소비하기 때문에, 다음과 같은 코드는

std::scanf("%d", &a);
std::scanf("%d", &b);

서로 다른 줄에 입력된 두 정수를 읽을 것입니다(두 번째 % d 가 첫 번째 입력 후 남은 개행 문자를 소비함) 또는 같은 줄에 공백이나 탭으로 구분된 두 정수를 읽을 것입니다(두 번째 % d 가 공백이나 탭을 소비함).

The conversion specifiers that do not consume leading whitespace, such as % c , can be made to do so by using a whitespace character in the format string:

std::scanf("%d", &a);
std::scanf(" %c", &c); // %d 이후의 개행 문자를 무시하고 문자 하나를 읽습니다

일부 std::sscanf 구현은 std::strlen 호출을 포함하므로, 전체 문자열 길이에 대해 런타임이 선형적으로 증가할 수 있습니다. 이는 std::sscanf 를 반복적으로 호출하여 문자열 앞부분에서 값을 파싱할 경우 코드가 2차 시간에 실행될 수 있음을 의미합니다 ( 예시 ).

예제

이 코드 실행

#include <clocale>
#include <cstdio>
#include <iostream>
int main()
{
    int i, j;
    float x, y;
    char str1[10], str2[4];
    wchar_t warr[2];
    std::setlocale(LC_ALL, "en_US.utf8");
    char input[] = "25 54.32E-1 Thompson 56789 0123 56ß水";
    // 다음과 같이 파싱:
    // %d: 정수
    // %f: 부동소수점 값
    // %9s: 최대 9개의 공백이 아닌 문자로 이루어진 문자열
    // %2d: 두 자리 정수 (숫자 5와 6)
    // %f: 부동소수점 값 (숫자 7, 8, 9)
    // %*d: 어디에도 저장되지 않는 정수
    // ' ': 모든 연속된 공백
    // %3[0-9]: 최대 3자리 숫자 문자열 (숫자 5와 6)
    // %2lc: 멀티바이트에서 와이드 문자로 변환하여 두 개의 와이드 문자
    const int ret = std::sscanf(input, "%d%f%9s%2d%f%*d %3[0-9]%2lc",
                                &i, &x, str1, &j, &y, str2, warr);
    std::cout << "Converted " << ret << " fields:\n"
                 "i = " << i << "\n"
                 "x = " << x << "\n"
                 "str1 = " << str1 << "\n"
                 "j = " << j << "\n"
                 "y = " << y << "\n"
                 "str2 = " << str2 << std::hex << "\n"
                 "warr[0] = U+" << (int)warr[0] << "\n"
                 "warr[1] = U+" << (int)warr[1] << '\n';
}

출력:

Converted 7 fields:
i = 25
x = 5.432
str1 = Thompson
j = 56
y = 789
str2 = 56
warr[0] = U+df
warr[1] = U+6c34

참고 항목

vscanf vfscanf vsscanf (C++11) (C++11) (C++11)	가변 인수 목록을 사용하여 stdin , 파일 스트림 또는 버퍼에서 형식화된 입력을 읽음 (함수)
fgets	파일 스트림에서 문자열을 가져옴 (함수)
printf fprintf sprintf snprintf (C++11)	형식화된 출력을 stdout , 파일 스트림 또는 버퍼에 출력 (함수)
from_chars (C++17)	문자 시퀀스를 정수 또는 부동 소수점 값으로 변환 (함수)
C 문서 for scanf , fscanf , sscanf

Compiler support
Freestanding and hosted
Language
Standard library
Standard library headers
Named requirements
Feature test macros (C++20)
Language support library
Concepts library (C++20)
Diagnostics library
Memory management library
Metaprogramming library (C++11)
General utilities library
Containers library
Iterators library
Ranges library (C++20)
Algorithms library
Strings library
Text processing library
Numerics library
Date and time library
Input/output library
Filesystem library (C++17)
Concurrency support library (C++11)
Execution control library (C++26)
Technical specifications
Symbols index
External libraries

I/O manipulators
Print functions (C++23)
C-style I/O
Buffers
basic_streambuf
basic_filebuf
basic_stringbuf
basic_spanbuf (C++23)
strstreambuf ( C++98/26* )
basic_syncbuf (C++20)
Streams
Abstractions
ios_base
basic_ios
basic_istream
basic_ostream
basic_iostream
File I/O
basic_ifstream
basic_ofstream
basic_fstream
String I/O
basic_istringstream
basic_ostringstream
basic_stringstream
Array I/O
basic_ispanstream (C++23)
basic_ospanstream (C++23)
basic_spanstream (C++23)
istrstream ( C++98/26* )
ostrstream ( C++98/26* )
strstream ( C++98/26* )
Synchronized Output
basic_osyncstream (C++20)
Types
streamoff
streamsize
fpos
Error category interface
iostream_category (C++11)
io_errc (C++11)

cppreference.net

Namespaces

Variants

std:: scanf, std:: fscanf, std:: sscanf

목차

매개변수

반환값

복잡도

참고 사항

예제

참고 항목

stream	-	입력 파일 스트림 (읽기용)
buffer	-	널 종료 문자열을 읽을 포인터
format	-	입력 읽기 방식을 지정하는 널 종료 문자열 포인터
...	-	수신 인자들