-
2-1 0과 1로 숫자를 표현하는 방법
-
정보단위
-
비트(bit) : 0과 1을 표현하는 가장 작은 정보 단위
-
워드(word)
-
이진법 : 0과 1로 숫자 표현하기
-
이진법(binary)
-
0과 1로 음수 표현하기 : 2의 보수
-
십육진법
-
2-2 0과 1로 문자를 표현하는 방법
-
문자집합과 인코딩
-
아스키 코드
-
한글 인코딩 : 완성형 vs 조합형 인코딩
-
EUC-KR
-
유니코드 문자 집합과 utf-8
2-1 0과 1로 숫자를 표현하는 방법

정보단위
비트(bit) : 0과 1을 표현하는 가장 작은 정보 단위
- n비트로 2n가지 정보 표현 가능
- 프로그램은 수많은 비트로 이루어져 있음
- 다만, 평소에 “이 파일은 ~~ 비트야.”라고 표현하진 않음
- 비트보다 더 큰 단위를 사용 ex) 바이트, 킬로바이트, 메가바이트, 기가바이트, 테라바이트 …



워드(word)
- CPU가 한 번에 처리할 수 있는 정보의 크기 단위
- 하프 워드 (half word) : 워드의 절반 크기
- 풀 워드 (full word) : 워드 크기
- 더블 워드 (double word) : 워드의 두 배 크기
이진법 : 0과 1로 숫자 표현하기
이진법(binary)
- 0과 1로 수를 표현하는 방법
- 숫자가 1을 넘어가는 시점에 자리올림
- 우리가 일상적으로 사용하는 진법은 9를 넘어갈 때 자리 올림을하는 십진법(decimal)


0과 1로 음수 표현하기 : 2의 보수
-어떤 수를 그보다 큰 2n에서 뺀 값

- 모든 0과 1을 뒤집고 1 더한 값



- 플래그(flag) 레지스터

십육진법
- 이진법으로는 숫자의 길이가 너무 길어진다.
- 그래서 컴퓨터의 데이터를 표현할 때 십육진법도 많이 사용




이진수 ↔ 십육진수 변환이 간편하기에 많이 사용.
십육진수 → 이진수

이진수→십육진수

2-2 0과 1로 문자를 표현하는 방법

문자집합과 인코딩
- 문자 집합(character set) : 컴퓨터가 이해할 수 있는 문자의 모음
- 인코딩 (encoding) : 코드화 하는 과정. 문자를 0과 1로 이루어진 문자 코드로 변환하는 과정.
- 디코딩 (decoding) : 코드를 해석하는 과정. 0과 1로 표현된 문자 코드로 문자로 변환하는 과정.

아스키 코드
- 초장기 문자 집합 중 하나.
- 알파벳, 아라비아 숫자, 일부 특수 문자 및 제어 문자
- 7비트로 하나의 문자 표현.

- 간단한 인코딩
- but 한글을 포함한 다르 언어의 문자 다양한 특수 문자 표현 불가
한글 인코딩 : 완성형 vs 조합형 인코딩
- 한글을 위한 인코딩이 필요

EUC-KR
- 문자 집합 기반의 한글 인코딩 방식
- 완성형 인코딩
- 글자 하나 하나에 2바이트 크기의 코드 부여
- 2300여개의 한글 표현 가능
- 여전히 모든 한글을 표현하기에는 부족한 수
- 쀏, 뙠, 휔 같은 한글은 표현 불가능

문제점
-모든 한글을 표현하기에는 부족한 수
-언어별 인코딩을 국가마다 하게 되면, 다국어를 지원하는 프로그램을 개발할 때엔 언어별 인코딩 방식을 모두 이해해야 함.

유니코드 문자 집합과 utf-8
- 유니코드
- 유니코드의 인코딩 방식

- utf-8 인코딩



'CS > 컴퓨터 구조' 카테고리의 다른 글
혼자 공부하는 컴퓨터 구조 1강 (0) | 2025.02.24 |
---|