Forum und email

문자열

string은 일련의 문자들이다. PHP에서 문자는 바이트와 같다. 즉 정확히 서로다른 256개의 문자를 사용할수 있다. 또한 PHP는 기본적으로 유니코드 지원을 갖지않는다. 유니코드에 대한 지원은 utf8_encode()utf8_decode()함수를 참고

Note: 문자열이 아무 문제없이 매우 커질수 있다. PHP에서 사용되는 문자열은 실질적으로 범위제한을 갖지 않는다. 그래서 긴 문자열에 대해서 걱정할 이유가 전혀 없다.

문법

문자열 리터럴은 3가지 다른 방식으로 표현될수 있다.

작은 따옴표

단순한 문자열을 표현하는 가장 간단한 방법이 작은 따옴표 (문자 ')로 문자열을 둘러싸면 된다.

작은따옴표를 리터럴로 표현하려면 역슬래쉬(\)로 회피할 필요가 있다. 다른 많은 언어에서도 이와같은 방식을 사용한다. 작은 따옴표 앞이나 문자열의 끝에서 역슬래쉬가 있을필요가 있으면, 이것은 중복사용할 필요가 있다. 다른 모든 문자를 회피하려하면 역슬래쉬가 출력되어야 할것이란 것에 주의하라! 그래서 보통은 역슬래쉬 자체를 회피할 필요가 없다.

Note: PHP 3에서 이와 같은 일이 발생하면 E_NOTICE레벨의 경고가 출력될것이다.

Note: 이외 다른 두가지 문법과는 달리 작은 따옴표로 둘러싸인 문자열에서 변수와 특별한 문자를 위한 회피는 전개되지 못한다.

<?php
echo 'this is a simple string';

echo 
'You can also have embedded newlines in 
strings this way as it is
okay to do'
;

// Outputs: Arnold once said: "I'll be back"
echo 'Arnold once said: "I\'ll be back"';

// Outputs: You deleted C:\*.*?
echo 'You deleted C:\\*.*?';

// Outputs: You deleted C:\*.*?
echo 'You deleted C:\*.*?';

// Outputs: This will not expand: \n a newline
echo 'This will not expand: \n a newline';

// Outputs: Variables do not $expand $either
echo 'Variables do not $expand $either';
?>

큰 따옴표

문자열이 큰따옴표(")로 둘러싸이면, PHP는 특별한 문자의 회피를 더 잘 이해한다.

회피 문자
sequence meaning
\n linefeed (LF or 0x0A (10) in ASCII)
\r carriage return (CR or 0x0D (13) in ASCII)
\t horizontal tab (HT or 0x09 (9) in ASCII)
\\ backslash
\$ dollar sign
\" double-quote
\[0-7]{1,3} 이 정규표현식은 8진표기법의 일련의 문자이다.
\x[0-9A-Fa-f]{1,2} 이 정규표현식은 16진표기법의 일련의 문자이다.

다시 얘기하면, 다른 어떤 문자를 회피하려한다면, 역슬래쉬도 출력될것이다!

그러나 큰따옴표로 둘러싸인 문자열의 가장 중요한 특징은 변수명이 전개될것이란 사실이다. 더 자세한 사항은 문자열 해석을 참고.

히어닥 문법

문자열을 구분하는 다른 방법은 히어닥 문법("<<<")을 사용하는것이다. <<<이후에 식별자가 와야 하고 그다음에 문자열, 그다음에 인용을 닫는 어떤 식별자가 와야 한다.

닫기 식별자는 그 줄의 첫번째 컬럼에서 시작되어야 한다. 또한, 식별자는 PHP의 다른 라벨과 같은 명명규칙을 따라야 한다: 오직 알파벳 숫자와 밑줄을 포함하고 숫자가 아닌 문자나 밑줄로 시작되어야 한다.

Warning

닫기 식별자를 갖는 줄은 가능한 세미콜른(;)를 제외하고 다른 문자를 포함하지 않는다는것에 주의해야 한다. 이말은 특별히 식별자가 줄맞춤이 되지 않을 것이고 어떤 공백이나 탭문자도 세미콜른의 앞이나 뒤에 있지 않을것이란 것이다. 닫기 식별자 전의 첫 문자는 운영체제에서 정의된 새줄이 되어야 한다는 것을 인식해야 한다. 예를 들면 매킨토시에서는 \r이 된다.

이 규칙을 깨고 닫기 식별자가 "확실"하지 않으면, 닫기 식별자로 인식되지 않으며 PHP는 다른 식별자를 계속 찾게 될것이다. 그래서 적절한 닫기 식별자가 발견되지 않으면 스크립트 끝의 줄번호로 해석 에러가 출력될것이다.

히어닥 텍스트는 큰따옴표가 없지만 큰따옴표로 둘러싸인 문자열처럼 동작한다. 히어닥에서는 따옴표를 회피할 필요가 없다는 의미를 갖는다. 그러나 여전히 위에서 열거한 회피 코드를 사용할수 있다. 문자가 전개되면, 히어닥 안의 복합 변수를 문자열로 표현할때 같은 주의가 필요하다.

Example#1 히어닥 문자열 인용 예

<?php
$str 
= <<<EOD
Example of string
spanning multiple lines
using heredoc syntax.
EOD;

/* More complex example, with variables. */
class foo
{
    var 
$foo;
    var 
$bar;

    function 
foo()
    {
        
$this->foo 'Foo';
        
$this->bar = array('Bar1''Bar2''Bar3');
    }
}

$foo = new foo();
$name 'MyName';

echo <<<EOT
My name is "$name". I am printing some $foo->foo.
Now, I am printing some 
{$foo->bar[1]}.
This should print a capital 'A': \x41
EOT;
?>

Note: 히어닥 지원은 PHP 4에서 추가되었다.

변수 해석

문자열이 큰따옴표나 히어닥으로 표현되면 변수는 그 안에서 해석된다.

두가지 형태의 문법이 존재한다: 단순문법과 복합문법이다. 단순 문법은 가장 일반적이고 가장 편하다. 이 문법은 변수나 array값, object속성을 해석하는 방법을 제공한다.

복합 문법은 PHP 4에서부터 지원되고, 중괄호로 둘러싸는 표현으로 인식된다.

단순 문법

달러사인($)과 만나면, 해석기는 가능한 많은 토큰을 취해서 유효한 변수명을 형성하게 된다. 중괄호로 변수명을 둘러싸면 이름의 끝을 명시적으로 표시하려는 것이다.

<?php
$beer 
'Heineken';
echo 
"$beer's taste is great"// works, "'" is an invalid character for varnames
echo "He drank some $beers";   // won't work, 's' is a valid character for varnames
echo "He drank some ${beer}s"// works
echo "He drank some {$beer}s"// works
?>

비슷하게, array 인덱스나 해석된 object특성을 보유할수 있다. 배열 인덱스로 닫음 대괄호 (])는 인덱스의 끝을 표시한다. 객체 속성은 변수를 갖는 트릭이 존재하지 않지만, 객체 특성에 대해서 단순한 변수에 적용되는 규칙과 같다.

<?php
// These examples are specific to using arrays inside of strings.
// When outside of a string, always quote your array string keys 
// and do not use {braces} when outside of strings either.

// Let's show all errors
error_reporting(E_ALL);

$fruits = array('strawberry' => 'red''banana' => 'yellow');

// Works but note that this works differently outside string-quotes
echo "A banana is $fruits[banana].";

// Works
echo "A banana is {$fruits['banana']}.";

// Works but PHP looks for a constant named banana first
// as described below.
echo "A banana is {$fruits[banana]}.";

// Won't work, use braces.  This results in a parse error.
echo "A banana is $fruits['banana'].";

// Works
echo "A banana is " $fruits['banana'] . ".";

// Works
echo "This square is $square->width meters broad.";

// Won't work. For a solution, see the complex syntax.
echo "This square is $square->width00 centimeters broad.";
?>

좀더 복잡한 변수에 대해서, 복합 문법을 사용해야 한다.

복합(curly) 문법

이 방법은 문법이 복합적이라서 복합이라고 부르는것이 아니다. 대신에 이 방법으로 복합 표현식을 포함할수 있기 때문이다.

사실, 이 문법으로 문자열의 네임스페이스에 존재하는 어떤변수 도 포함할수 있다. 단순히 문자열을 드러내는 방법과 동일한 표현식을 쓸수 있다. 그리고 { 과 } 안에 그것을 포함한다. '{'를 회피할 수 없기 때문에 이 문법은 $가 즉시 {뒤에 올때만 인식된다. ("{$" 리터럴을 쓰려면 "{\$" 이나 "\{$" 을 사용하라). 몇가지 예를 보고 위 설명을 이해해보자:

<?php
// 모든 에러를 보여줍니다.
error_reporting(E_ALL);

$great 'fantastic';

// 작동하지 않습니다, 출력: This is { fantastic}
echo "This is { $great}";

// 작동합니다, 출력: This is fantastic
echo "This is {$great}";
echo 
"This is ${great}";

// 작동합니다.
echo "This square is {$square->width}00 centimeters broad."

// 작동합니다.
echo "This works: {$arr[4][3]}";

// $foo[bar]가 문자열 밖에서 유효하지 않은 것과 마찬가지로,
// 잘못되었습니다. 즉, 이는 작동하지만 PHP는 먼저 상수 이름
// foo를 찾고, E_NOTICE 레벨의 오류(정의되지 않은 상수)를
// 발생합니다.
echo "This is wrong: {$arr[foo][3]}"

// 작동합니다. 문자열 안에서 다차원 배열을 사용할 때는,
// 항상 배열 주위를 중괄호로 감싸주십시오.
echo "This works: {$arr['foo'][3]}";

// 작동합니다.
echo "This works: " $arr['foo'][3];

echo 
"You can even write {$obj->values[3]->name}";

echo 
"This is the value of the var named $name: {${$name}}";
?>

문자열의 문자에 접근 및 변경

문자열 내의 문자들 중 원하는 문자를 중괄호안에 0을 기준으로 한 위치를 표기하여 접근하고, 변경할 수 있습니다.

Note: 하위 버전과의 호환을 위해, 같은 목적으로 대괄호를 사용할 수 있습니다. 하지만, 이 문법은 PHP 4에서 배제되었습니다.

Example#2 몇 가지 문자열 예

<?php
// Get the first character of a string
$str 'This is a test.';
$first $str{0};

// Get the third character of a string
$third $str{2};

// Get the last character of a string.
$str 'This is still a test.';
$last $str{strlen($str)-1}; 

// 문자열의 마지막 문자를 변경.
$str 'Look at the sea';
$str{strlen($str)-1} = 'e';

?>

유용한 함수와 연산자

문자열들은 '.' (점) 연산자를 사용하여 합칠수 있다. '+' (덧셈) 연산자는 이 목적에 부합되지 않는다는 것에 주의해야 한다. 자세한 정보는 문자열 연산자를 참고

문자열 조작을 위한 많은 유용한 함수가 지원된다.

일반적인 기능을 대해서는 문자열 함수 섹션을 참고하고, 향상된 find&replace 기능을 위해 정규표현식 함수를 참고 (두가지 중 선택할수 있다: PerlPOSIX extended).

URL-문자열을 위한 함수와 문자열을 encrypt/decrypt하는 함수도 지원된다. (mcryptmhash).

그래도 원하는 기능을 찾을수 없다면, 문자 타입 함수로 참고.

문자열로 변환

(string)이나 strval()함수를 사용하여 값을 문자열로 변환할수 있다. 문자열 변환은 문자열이 필요한 표현식의 유효영역 내에서 자동적으로 이루어진다.이런 일은 echo()print()함수를 쓸때, 또는 변수값을 문자열과 비교할때 발생한다. 타입타입 저글링 매뉴얼 섹션을 읽음으로써 다음에서 설명하는 것을 더욱 명확하게 이해하게 될것이다. settype()함수도 참고.

boolean TRUE값은 문자열 "1"로 변환된다. FALSE 값은 "" (빈 문자열)로 표현된다. 이 원리로 논리값과 문자열값 사이에서 어느 방향으로든 변환이 가능하다.

integer나 부동소수점(float)은 각 자리의 숫자를 문자열로 변환할수 있다 (부동소수점수에 대한 지수부를 포함함).

배열은 항상 문자열 "Array"로 변환된다. 그래서 배열 안에 무엇이 들었는지 보기 위해 echo()print()를 쓴다고 해서 array의 내용을 덤프할수 없다. 한 요소를 보기 위해서는 echo $arr['foo']와 같이 써줘야 한다. 전체 내용물을 덤프/보기 위한 팁을 아래글에서 볼수 있다.

객체는 항상 문자열 "Object"로 변환된다. 만약 디버깅 목적으로 object의 멤버 변수를 모두 출력하고 싶으면, 아래 단락을 보라. 특정 객체를 만들어내는 클래스명을 확인하려한다면, get_class()를 사용하라.

자원은 항상 구조체 "Resource id #1"를 갖는 문자열로 변환된다. 1은 실행기간동안 PHP에 의해 설정되는 resource의 유일한 수이다. 자원의 타입을 얻고자 하면, get_resource_type()함수를 사용하라.

NULL 은 항상 빈 문자열로 변환된다.

위글에서 볼수 있듯이, 배열, 객체 또는 자원을 출력하는 것은 배열자체에 대한 어떤 유용한 정보도 제공해주지 않는다. 디버깅을 위해 그 값들을 출력하는 가장 좋은 방법인 print_r()var_dump() 함수를 참고할것.

PHP 값을 지속적으로 저장하기 위해 문자열로 변환할수 있다. 이런 방법을 직렬화(serialization)라고 한다. 함수 serialize()를 사용하면 된다. PHP 값을 XML 구조체로 직렬화할수도 있다. PHP 설정시 WDDX 지원 옵션을 추가하면 된다.

문자열을 숫자로 변환하기

문자열을 숫자값으로 취급할때, 결과값과 타입은 다음과 같이 결정된다.

그 값이 '.', 'e', 'E' 중에 어느것이든 포함하고 있으면 float으로 취급될것이다. 그렇지 않으면, 정수로 취급할것이다.

그 값은 문자열의 시작부분에 의해 주어진다. 문자열이 유효한 숫자 데이터로 시작되면, 이것이 사용되는 값이 될것이다. 그렇지 않으면 그 값은 0(zero)로 된다. 유효한 숫자 데이터는 선택적인 부호, 한자리 이상(선택적인 십진 포인트를 포함)의 수, 선택적인 지수가 될수있다. 지수는 한자리 이상의 수가 'e' 이나 'E'의 뒤에 오면 된다.

<?php
$foo 
"10.5";                // $foo is float (11.5)
$foo "-1.3e3";              // $foo is float (-1299)
$foo "bob-1.3e3";           // $foo is integer (1)
$foo "bob3";                // $foo is integer (1)
$foo "10 Small Pigs";       // $foo is integer (11)
$foo "10.2 Little Piggies"// $foo is float (14.2)
$foo "10.0 pigs " 1;          // $foo is float (11)
$foo "10.0 pigs " 1.0;        // $foo is float (11)     
?>

이런 종류의 변환에 대한 더 많은 정보는 strtod(3)의 유닉스 매뉴얼 페이지에서 볼수 있다.

이 섹션의 어떤 예제를 테스트하려면, 예제를 복사해서 붙여넣으면 되고 무슨일이 일어나는지 확인하기 위해 다음 줄을 삽입할수 있다.

<?php
echo "\$foo==$foo; type is " gettype ($foo) . "<br />\n";
?>

정수로 변환하여 한 문자의 코드를 얻을수 있다고 기대하지 마시오 (예를 들면 C에서 하는 것처럼). 캐릭터코드와 문자 사이의 변환을 위해서는 ord()chr()함수를 사용할수 있다.