JavaScript - Day 11
RegExp
정규 표현식이란?
정규 표현식은 일정한 패턴을 가진 문자열의 집합을 표현하기 위해 사용하는 형식 언어다.
정규 표현식은 문자열을 대상으로 패턴 매칭 기능을 제공하며, 패턴 매칭 기능이란 특정 패턴과 일치하는 문자열을 검색하거나 추출 또는 치환할 수 있는 기능을 말한다.
정규 표현식을 사용하면 반복문과 조건문 없이 패턴을 정의하고 테스트하는 것으로 간단히 체크할 수 있다. 다만 정규 표현식은 주석이나 공백을 허용하지 않고 여러가지 기호를 혼합하여 사용하기 때문에 가독성이 좋지 않다는 문제가 있다.
정규 표현식의 생성
정규 표현식 객체를 생성하기 위해서는 정규 표현식 리터럴과 RegExp 생성자 함수를 사용할 수 있다.
const target = 'Is this all there is?';
// 패턴: is
// 플래그: i => 대소문자를 구별하지 않고 검색한다.
const regexp = /is/i;
regexp.test(target); // true
const target = 'Is this all there is?';
const regexp = new RegExp(/is/i);
// const regexp = new RegExp(/is/, 'i');
// const regexp = new RegExp('is', 'i');
regexp.test(target); // true
RegExp 메서드
RegExp.prototype.exec
exec 메서드는 인수로 전달받은 문자열에 대해 정규 표현식의 패턴을 검색하여 매칭 결과를 배열로 반환한다.
const taret = 'Is this all there is?';
const regExp = /is/;
regExp.exec(target);
// ["is", index = 5, input: "Is this all there is?", groups: undefined]
RegExp.prototype.test
test 메서드는 인수로 전달받은 문자열에 대해 정규 표현식의 패턴을 검색하여 매칭 결과를 불리언 값으로 반환한다.
const target = 'Is this all there is?';
const regExp = /is/;
regExp.test(target); // true
String.prototype.match
match 메서드는 대상 문자열과 인수로 전달받은 정규 표현식과의 매칭 결과를 배열로 반환한다.
const target = 'Is this all there is?';
const regExp = /is/;
target.match(regExp);
// ["is", index = 5, input: "Is this all there is?", groups: undefined]
플래그
패턴과 함께 정규 표현식을 구성하는 정규 표현식의 검색 방식을 설정하기 위해 사용한다.
| 플래그 | 의미 | 설명 |
|---|---|---|
| i | Ignore case | 대소문자를 구별하지 않고 패턴을 검색한다. |
| g | Global | 대상 문자열 내에서 패턴과 일치하는 모든 문자열을 전역 검색한다. |
| m | Multi line | 문자열의 행이 바뀌더라도 패턴 검색을 계속한다. |
패턴
정규 표현식은 패턴과 플래그로 구성된다.
정규 표현식의 패턴은 문자열의 일정한 규칙을 표현하기 위해 사용하며, 정규 표현식의 플래그는 정규 표현식의 검색 방식을 설정하기 위해 사용한다.
문자열 검색
정규 표현식의 패턴에 문자 또는 문자열을 지정하면 검색 대상 문자열에서 패턴으로 지정한 문자 또는 문자열을 검색한다.
const target = 'Is this all there is?';
const regExp = /is/;
regExp.test(target); // true
target.match(regExp); // ["is", index: 5, input: "Is this all there is?, groups: undefined]
임의의 문자열 검색
.은 임의의 문자 한 개를 의미한다.
.을 3개 연속하여 패턴을 생성했으므로 문자의 내용과 상관없이 3자리 문자열과 매치한다.
const target = 'Is this all there is?';
const regExp = / ... /g;
target.match(regExp);
// ["Is ", "thi", "s a", "ll ", "the", "re ", "is?"]
반복 검색
// {m, n}은 앞선 패턴이 최소 m번, 최대 n번 반복되는 문자열을 의미한다.
const target = 'A AA B BB Aa Bb AAA';
const regExp = /A{1, 2}/g;
target.match(regExp); // ["A", "AA", "A", "AA", "A"]
// {n}은 앞선 패턴이 n번 반복되는 문자열을 의미한다.
// 즉, {n}은 {n, n}과 같다.
const regExp = /A{2}/g;
target.match(regExp); // ["AA", "AA"]
// {n, }은 앞선 패턴이 최소 n번 이상 반복되는 문자열을 의미한다.
const regExp = /A{2,}/g;
taret.match(regExp); // ["AA", "AAA"]
// +는 앞선 패턴이 최소 한번 이상 반복되는 문자열을 의미한다.
const regExp = /A+/g;
target.match(regExp); // ["A", "AA", "A", "AAA"]
// ?는 앞선 패턴이 최대 한 번 이상 반복되는 문자열을 의미한다.
const target = 'color colour';
const regExp = /colou?r/g;
target.match(regExp); // ["color", "colour"]
OR 검색
// '|' 는 or의 의미를 갖는다. 다음 예제의 /A|B/는 'A' 또는 'B'를 의미한다.
const target = 'A AA B BB Aa Bb';
const regExp = /A|B/g';
target.match(regExp); // ["A", "A", "A", "B", "B", "B", "A", "B"]
// 분해되지 않은 단어 레벨로 검색하기 위해서는 +를 함께 사용한다.
// 범위를 지정하려면 []내에 -를 사용한다.
// \d는 숫자를 의미한다. \D는 문자를 의미한다. \w는 알파벳, 숫자, 언더스코어를 의미한다.
// \W는 문자를 의미한다.
NOT 검색
// [ ... ] 내의 ^은 not의 의미를 갖는다.
const target = 'AA BB 12 Aa Bb';
const regExp = /[^0-9]+/g;
target.match(regExp); // ["AA BB ", " Aa Bb"]
시작 위치로 검색
// [ ... ] 밖의 ^은 문자열의 시작을 의미한다.
const target = 'https://google.com';
const regExp = /^https/;
regExp.test(target); // true
마지막 위치로 검색
// $는 문자열의 마지막을 의미한다.
const target = 'https://google.com';
const regExp = /com$/;
regExp.test(target); // true
자주 사용하는 정규표현식
특정 단어로 시작하는지 검사
// 문자열이 'http://' 또는 'https://'로 시작하는지 검사한다.
const url = 'https://example.com';
/^https?:\/\//.test(url); // true
특정 단어로 끝나는지 검사
const fileName = 'index.html';
/html$/.test(fileName); // true
숫자로만 이루어진 문자열인지 검사
const target = '12345';
/^d+$/.test(target); // true
하나 이상의 공백으로 시작하는지 검사
const target = ' Hi!';
/^[\s]+/.test(target); // true
아이디로 사용 가능한지 검사
const id = 'abc123';
/^[A-Za-z0-9]{4, 10}$/.test(id); // true
메일 주소 형식에 맞는지 검사
const email = "sung@gmail.com";
/^[0-9a-zA-Z]([-_\.]?[0-9a-zA-Z])*@[0-9a-zA-Z]([-_\.]?[0-9a-zA-Z])*\.[a-zA-Z]{2,3}$/.
test(email); // true
핸드폰 번호 형식에 맞는지 검사
const cellphone = '010-1234-5678';
/^\d{3}-\d{3,4}-\d{4}$/.test(cellphone); // true
특수 문자 포함 여부 검사
const target = 'abc#123';
(/[^A-Za-z0-9]\gi).test(target); // true
String
원시 타입인 문자열을 다룰때 유용한 프로퍼티와 메서드를 제공한다.
String 생성자 함수
new 연산자와 함께 호출하여 String 인스턴스를 생성할 수 있다.
const strObj = new String();
console.log(strObj); // String {length: 0, [[PrimitiveValue]]: ""}
const strObj = new String('Lee');
console.log(strObj); // String {0: "L", 1: "e", 2: "e", length: 3, [[P.V]]: "Lee"}
console.log(strObj[0]); // L
strObj[0] = 'S';
console.log(strObj); // Lee
length 프로퍼티
length 프로퍼티는 문자열의 문자 개수를 반환한다.
'Hello'.length; // 5
'안녕하세요'.length; // 6
String 메서드
String 객체에는 원본 String 래퍼 객체를 직접 변경하는 메서드는 존재하지 않는다.
즉, String 객체의 메서드는 언제나 새로운 문자열을 반환한다.
문자열은 변경 불가능한 원시 값이기 때문에 String 래퍼 객체도 읽기 전용 객체로 제공된다.
String.prototype.indexOf
indexOf 메서드는 대상 문자열에서 인수로 전달받은 문자열을 검색하여 첫 번째 인덱스를 반환한다.
검색에 실패하면 -1을 반환한다.
const str = 'Hello World';
str.indexOf('l'); // 2
str.indexOf('or'); // 7
str.indexOf('x'); // -1
// indexOf 메서드의 2번째 인수로 검색을 시작할 인덱스를 전달할 수 있다.
str.indexOf('l', 3); // 3
String.prototype.search
search 메서드는 대상 문자열에서 인수로 전달받은 정규 표현식과 매치하는 문자열을 검색하여 일치하는 문자열의 인덱스를 반환한다.
const str = 'Hello world';
str.search(/o/); // 4
str.search(/x/); // -1
String.prototype.includes
includes 메서드는 대상 문자열에 인수로 전달받은 문자열이 포함되어 있는지 확인하여 그 결과를 true 또는 false로 반환한다.
const str = 'Hello world';
str.includes('Hello'); // true
str.includes(''); // true
str.includes('x'); // false
str.includes(); // false
// includes 메서드의 2번째 인수로 검색을 시작할 인덱스를 전달할 수 있다.
str.includes('l', 3); // true
str.includes('H', 3); // false
String.prototype.startsWith
startsWith 메서드는 대상 문자열이 인수로 전달받은 문자열로 시작하는지 확인하여 그 결과를 true 또는 false로 반환한다.
const str = 'Hello world';
str.startsWith('He'); // true
str.startsWith('x'); // false
// startsWith 메서드의 2번째 인수로 검색을 시작할 인덱스를 전달할 수 있다.
str.startsWith(' ', 5); // true
String.prototype.endsWith
endsWith 메서드는 대상 문자열이 인수로 전달받은 문자열로 끝나는지 확인하여 그 결과를 true 또는 false로 반환한다.
const str = 'Hello world';
str.endsWith('ld'); // true
str.endsWith('x'); // false
// endsWith 메서드의 2번째 인수로 검색할 문자열의 길이로 전달할 수 있다.
// 문자열 str의 처음부터 5자리 까지 'lo'로 끝나는지 확인
str.endsWith('lo', 5); // true
String.prototype.charAt
charAt 메서드는 대상 문자열에서 인수로 전달받은 인덱스에 위치한 문자를 검색하여 반환한다.
const str = 'Hello';
for (let i = 0; i< str.length; i++){
console.log(str.charAt(i)); // H e l l o
}
// 인덱스가 문자열의 범위를 벗어난 경우 빈 문자열을 반환한다.
str.charAt(5); // ''
String.prototype.substring
substring 메서드는 대상 문자열에서 첫 번째 인수로 전달받은 인덱스에 위치하는 문자부터 두 번째 인수로 전달받은 인덱스에 위치하는 문자 바로 이전 문자 까지의 부분 문자열을 반환한다.
const str = 'Hello World';
str.substring(1, 4); // ell
// 2번째 인수를 생략할 경우 첫 번째 인수로 전달한 인덱스에 위치하는 문자부터 마지막 문자까지
// 부분 문자열을 반환한다.
str.substring(1); // 'ello World'
String.prototype.slice
slice 메서드는 substring 메서드와 동일하게 동작한다. 단 slice 메서드에는 음수인 인수를 전달할 수 있다.
음수인 인수를 전달하면 대상 문자열의 가장 뒤에서부터 시작하여 문자열을 잘라내어 반환한다.
const str = 'hello world';
str.substring(0,5); // hello
str.slice(0, 5); // hello
str.substring(2); // llo world
str.slice(2); // llo world
str.substring(-5); // hello world
str.slice(-5); // world
String.prototype.toUpperCase
toUpperCase 메서드는 대상 문자열을 모두 대문자로 변경한 문자열을 반환한다.
const str = 'Hello World';
str.toUpperCase(); // 'HELLO WORLD'
String.prototype.toLowerCase
toLowerCase 메서드는 대상 문자열을 모두 소문자로 변경한 문자열을 반환한다.
const str = 'Hello World';
str.toLowerCase(); // 'hello world'
String.prototype.trim
trim 메서드는 대상 문자열 앞뒤에 공백 문자가 있을 경우 이를 제거한 문자열을 반환한다.
const str = ' foo ';
str.trim(); // 'foo'
String.prototype.repeat
repeat 메서드는 대상 문자열을 인수로 전달받은 정수만큼 반복해 연결한 새로운 문자열을 반환한다.
인수로 전달받은 정수가 0이면 빈 문자열을 반환하고, 음수이면 RangeError를 발생시킨다.
const str = 'abc';
str.repeat(); // ''
str.repeat(0); // ''
str.repeat(1); // 'abc'
str.repeat(2); // 'abcabc'
str.repeat(2.5); // 'abcabc'
str.repeat(-1); // RangeError: Invalid count vaue
String.prototype.replace
replace 메서드는 대상 문자열에서 첫 번째 인수로 전달받은 문자열 또는 정규표현식을 검색하여 두 번째 인수로 전달한 문자열로 치환한 문자열을 반환한다.
const str = 'Hello world';
str.replace('world', 'Lee'); // Hello Lee
String.prototype.split
split 메서드는 대상 문자열에서 첫 번째 인수로 전달한 문자열 또는 정규 표현식을 검색하여 문자열을 구분한 후 분리된 각 문자열로 이루어진 배열을 반환한다.
인수로 빈 문자열을 전달하면 각 문자를 모두 분리하고, 인수를 생략하면 대상 문자열 전체를 단일 요소로 하는 배열을 반환한다.
const str = 'How are you doing?';
str.split(' '); // ["How", "are", "you", "doing?"]
str.split(/\s/); // ["How", "are", "you", "doing?"]
str.split(''); // ["H", "o", "w", ... "i", "n", "g", "?"]
str.split(); // ["How are you doing?]
// 2 번째 인수로 배열의 길이를 지정할 수 있다.
str.split(' ', 3); // ["How", "are", "you"]
7 번째 데이터 타입 Symbol
심벌이란?
심벌은 ES6에서 도입된 7번째 데이터 타입으로 변경 불가능한 원시 타입의 값이다.
심벌 값은 다른 값과 중복되지 않는 유일무이한 값이다. 따라서 주로 이름의 충돌 위험이 없는 유일한 프로퍼티 키를 만들기 위해 사용한다.
심벌 값의 생성
Symbol 함수
심벌 값은 Symbol 함수를 호출하여 생성한다. 다른 원시값은 리터럴 표기법을 통해 값을 생성할 수 있지만 심벌 값은 Symbol 함수를 호출하여 생성해야 한다.
이때 생성된 심벌 값은 외부로 노출되지 않아 확인할 수 없으며, 다른 값과 절대 중복되지 않는 유일무이한 값이다.
const mySymbol = Symbol();
console.log(typeof mySymbol); // symbol
new Symbol(); // TypeError: Symbol is not a constructor
Symbol.for / Symbol.keyFor 메서드
Symbol.for 메서드는 인수로 전달받은 문자열을 키로 사용하여 키와 심벌 값의 쌍들이 저장되어 있는 전역 심벌 레지스트리에서 해당 키와 일치하는 심벌 값을 검색한다.
검색에 성공하면 새로운 심벌 값을 생성하지 않고 검색된 심벌 값을 반환한다.
검색에 실패하면 새로운 심벌 값을 생성하여 Symbol.for 메서드의 인수로 전달된 키로 전역 심벌 레지스트리에 저장한 후, 생성된 심벌 값을 반환한다.
const s1 = Symbol.for('mySymbol');
const s2 = Symbol.for('mySymbol');
console.log(s1 === s2); // true
Symbol.keyFor 메서드를 사용하면 전역 심벌 레지스트리에 저장된 심벌 값의 키를 추출할 수 있다.
const s1 = Symbol.for('mySymbol');
Symbol.keyFor(s1); // mySymbol
const s2 = Symbol('foo');
Symbol.keyFor(s2); // undefined
심벌과 상수
const Direction = {
UP: 1,
DOWN: 2,
LEFT: 3,
RIGHT: 4
};
const myDirection = Direction.UP;
if (myDirection === Direction.UP) {
console.log('You are going UP');
}
// 위 예제와 같이 값에는 특별한 의미가 없고 상수 이름 자체에 의미가 있는 경우가 있다. 이때 문제는
// 상수 값 1, 2, 3, 4가 변경될 수 있으며, 다를 변수 값과 중복될 수도 있다는 것이다.
// 이러한 경우 변경/중복될 가능성이 있는 무의미한 상수 대신 중복될 가능성이 없는 유일무이한 심벌
// 값을 사용할 수 있다.
const Direction = {
UP: Symbol('up'),
DOWN: Symbol('down'),
LEFT: Symbol('left'),
RIGHT: Symbol('right')
};
const myDirection = Direction.UP;
if (myDirection === Direction.UP) {
console.log('You are going UP.');
}
심벌과 프로퍼티 키
객체의 프로퍼티 키는 빈 문자열을 포함하는 모든 문자열 또는 심벌 값으로 만들 수 있으며, 동적으로 생성할 수도 있다.
심벌 값을 프로퍼티 키로 사용하려면 프로퍼티 키로 사용할 심벌 값에 대괄호를 사용해야 한다.
프로퍼티에 접근할 때도 마찬가지로 대괄호를 사용해야 한다.
심벌 값은 유일무이한 값으로 심벌 값으로 프로퍼티 키를 만들면 다른 프로퍼티 키와 절대 충돌하지 않는다.
const obj = {
[Symbol.for('mySymbol')]: 1
};
obj[Symbol.for('mySymbol')]; // 1
심벌과 프로퍼티 은닉
심벌 값을 프로퍼티 키로 사용하여 생성한 프로퍼티는 for … in 문이나 Object.keys, Object.getOwnPropertyNames 메서드로 찾을 수 없다.
이처럼 심벌 값을 프로퍼티 키로 사용하여 프로퍼티를 생성하면 외부에 노출할 필요가 없는 프로퍼티를 은닉할 수 있다.
const obj = {
[Symbol('mySymbol')]: 1
};
for (const key in obj) {
console.log(key); // 아무것도 출력되지 않는다.
}
console.log(Object.keys(obj)); // []
console.log(Object.getOwnPropertyNames(obj)); // []
// 하지만 Object.getOwnPropertySymbols 메서드를 사용하면 심벌 값을 프로퍼티 키로 사용하여
// 생성한 프로퍼티를 찾을 수 있다.
console.log(Object.getOwnPropertySymbols(obj)); // [Symbol(mySymbol)]
const symbolKey1 = Object.getOwnPropertySymbols(obj)[0];
console.log(obj[symbolKey1]); // 1
심벌과 표준 빌트인 객체 확장
일반적으로 표준 빌트인 객체에 사용자 정의 메서드를 직접 추가하여 확장하는 것은 권장하지 않는다.
표준 빌트인 객체는 읽기 전용으로 사용하는 것이 좋다.
하지만 중복될 가능성이 없는 심벌 값으로 프로퍼티 키를 생성하여 표준 빌트인 객체를 확장하면 표준 빌트인 객체의 기존 프로퍼티 키와 충돌하지 않는 것은 물론, 표준 사양의 버전이 올라감에 따라 추가될지 모르는 어떤 프로퍼티 키와도 충돌할 위험이 없어 안전하게 표준 빌트인 객체를 확장할 수 있다.
Array.prototype[Symbol.for('sum')] = function() {
return this.reduce((acc, cur) => acc + cur, 0);
};
[1, 2][Symbol.for('sum')](); // 3
Well-known Symbol
자바스크립트가 기본 제공하는 빌트인 심벌 값을 Well-known Symbol이라 부른다.