일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 포천수영장
- LGG6
- 덕소골프샵
- 태안수영장펜션
- 경기북부골프장
- 제주도
- 휘닉스파크
- 개복숭아 판매
- 한라산
- 자연산 개복숭아
- 포천가볼만한곳
- 제주도설경
- 자연산개복숭아
- 제주도눈
- 조경철천문대
- 야생개복숭아
- 괌
- 제주도눈썰매
- 야생개복숭아 판매
- 돌복숭아
- 충주골프장
- 파주골프장
- 개복숭아
- 서원힐스
- 개복숭아판매
- 잠실수영장
- 포천온천
- 괌자유여행
- 포천투어
- wp-900
- Today
- Total
Live Brilliant
awk 명령어 사용방법 본문
awk란 특정 패턴의 문자들을 원하는 형식으로 처리하는 강력한 유틸입니다.
한마디로 말해서 택스트파일로 저장되어있는 파일을 자신이 원하는 부분의 필드만 출력하기위해 사용되는 쉘프로그램입니다.
한예를 들어서
/etc/passwd 파일을보면 하나의 계정에 여러가지 내용이 콜론(:)으로 구분되어있습니다.
이 내용들을 원하는 부분만 출력하게 하기위해서
계정명: 패스워드(암호화):UID:GID:코멘트:홈디렉토리:기본쉘 순으로 되어있습니다.
이것을 계정명과 패스워드만 출력할려면
cat /etc/passwd | awk -F: '{print $1" "$2}'
이렇게 하면
root x
bin x
daemon x
adm x
lp x
sync x
이런씩을 나타납니다.
-F: 는 각항목들을 콜론(:)으로 구분하여 $1~갯수만큼 적용하라는 명령어
'{prin $1" "$2}' 는 $1과 $2을 출력하라라는 뜻입니다.
awk는 다음과 같은 구성으로 스크립트를 만들어냅니다.
awk '{.......}' 파일명
이때 ......에 들어갈 내용이 실제로 수행할 프로그램이라고 생각하시면 됩니다.
하지만 awk 스크립트를 만드실 때 가장 주의할 점이 awk 자체가 하나의 for 또는 while 문이라고 생각하셔야 합니다.
awk는 파일에 있는 내용을 기본적으로 한줄씩(레코드라고도 합니다.) 읽어서,
그 줄의 내용을 처리하되 공백으로 구분된 한 단어(필드라고 합니다.)를 별개로 구분하여
처리합니다. 한 줄을 처리하고 나면 동일한 규칙을 다음줄에도 적용합니다.
즉 awk에서 ....... 부분을 채우실때는 한줄을 어떻게 처리할 것인가만 신경을 쓰시면 됩니다.
즉 "oytzzz 90 89 95" 이 줄을 "name = oytzzz sum = 274 avg = 91.33"이렇게
만드는 스크립트만 ....... 에 넣으시고 실행하면 끝입니다.
이것은 쉽게 이해하시겠지요.
그러므로 ..... 부분에는 "name = " 첫번째필드 "sum = "두번째, 세번째, 네번째 필드 합계 "avg = " 2,3,4합계/3을 출력하는 코딩을 넣으면 되겠네요.
그리고 실행하시면 나머지줄에도 똑같은 규칙이 적용되어 원하는 결과가 나올겁니다.
awk에서 첫번째 필드는 $1입니다. 두번째는 $2 등등으로 되겠지요.
출력은 print나 printf인데 print로 설명하겠습니다.
print "출력문자열" 또는 print 변수명 하면 되구요 그냥 한칸 띠고 쓰면 출력이 붙고
,를 넣으면 탭으로 구분이 됩니다. 출력이 끝나면 줄이 바뀌구요.
awk '{print $1 $2, $3}' gumsu.txt
이 문장은 한줄을 읽어서 첫번째필드와 두번째 필드를 붙여서 출력한뒤 탭으로
구분하고 세번째필드를 출력한후 줄을 바꿉니다. 그리고 다음줄을 읽어 똑같은
일을 마지막줄까지 합니다.
awk '{print "test" $1}' gumsu.txt
awk '{print "sum:" $2+$3}' gumsu.txt
실행하시면 어떻게 될까요? 한번 해보시면 답이 보이실 겁니다.
화면에 출력이 원하는 대로 보이면
awk '{.......}' gumsu.txt > result.txt 하시면 됩니다. 그러면 result.txt파일에 저장됩니다.
~~~~~~~ Awk 명령어 사용법 ~~~~~~~~~~~~
o awk 명령어
awk라는 이름은 이를 개발한 세 사람의 이름 Aho, Weinberger, Kernighan에서 유래된 것이다.
awk명령어는 일련의 입력 화일을 읽어 지정된 패턴과 일치하는 패턴을 간직한 라인을 찾는다.
패턴이 일치하면 지정된 연산이 실행된다. 여기서의 연산은 라인 내의 필드 조작이나 필드값을
이용한 산술 연산을 의미한다. 이 awk는 shell programming과 bc 그리고 C 프로그래밍언어의 기능을 갖춘
프로그래밍 언어로 bc와 같이 완벽하게 해독이 되며 쉘의 인수인 $1, $2, $3과 같은 이름을 가진
필드 변수가 각 입력 라인에 사용될 수 있다. 또 C 언어와 유사한 프린팅, 제어 연산자도 가지고 있다.
awk의 사용에는 두가지 방법이 있다. 한가지 방법은 다음 형식으로 타이프하는 것이다.
# awk program filename --> program: 명령어들로 이루어짐
filename: awk가 작용할 화일의 명칭
# awk -f file filename --> file: 프로그램 명령어들을 포함하고 있는 화일의 명칭
프로그램은 하나 또는 그 이상의 프로그램 라인들로 이루어진다. 프로그램 라인은 일반적으로
패턴과 작용으로 이루어진다.
/rotate/ {print} --> 패턴은 rotate(단순한 문자열 패턴은 /들로 둘러싸임)
작용은 print이다.
이것을 사용하면 , awk 프로그램은 문자열 rotate를 포함하고 있는 라인들을 발견하고 그것들을 프린트한다.
그것은 grep rotate filename을 사용하는 것과 같다.
필드들은 공백들에 의해 분리된 문자열들이다.
awk 프로그램은 필드에 대한 레이블 시스템을 가지고 있다. $1은 첫 번째 필드이고 $2은 두 번째 필드이다.
$0은 특수한 의미를 갖는바, 그것은 전체 라인을 나타낸다.
---------------------------------------------------------------------------------------------
패 턴 의 미
---------------------------------------------------------------------------------------------
/fish/ 문자열 fish를 포함하고 있는 라인
$1 - /fish/ 첫번째 필드가 문자열 fish를 포함하고 있는 라인
$3 - /fish/ 세번째 " "
$1! - /fish/ 첫번째 필드가 문자열 fish를 포함하고 있지 않은 라인
---------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------
작 용 의 미
---------------------------------------------------------------------------------------------
{print $2} 두번째 필드만을 프린트하라
{print $4,$2} 네번째 필드의 내용을 프린트한 다음 두번째 필드의 내용을 프린트하라
{print $2,$2+$4} 두번째 필드를 프린트한 다음 두번째 필드와 네번째 필드의 합을 프린트하라
{s=$2+$4; print s} 두번째와 네번째 필드를 추가한 다음, 그 합을 프린트하라
---------------------------------------------------------------------------------------------
패턴에서의 ~와 !사용에 주목하라. ~는 우측에 있는 패턴이 좌측에 있는 필드에 포함된다는 것을 의미한다.
!~ 조합은 우측의 패턴이 좌측의 필드에 포함되지 않음을 의미한다.
{ }작용들을 세미콜론으로 분리시킴으로써 하나 이상의 작용들을 포함시킴 수 있다.
몇가지 이러한 개념들을 사용하는 간단한 예를 고찰해보자. 화일 sales는 여섯 열의 정보를 가지고 있다.
첫번째 열은 품목 명칭, 두번째 열은 품목의 판매가격 , 그리고 다음의 네 열들은 품목에 대한 분기별
판매수이다.
# vi sales
carts 29.99 45 13 55 22
corks 0.02 30 20 25 93
doors 49.99 40 15 20 25
geese 15.00 2 8 1 128
nighties 50.00 11 23 15 82
우리는 두 열을 추가하려 한다. 품목합계 그리고 현금 판매 합계.
다음과 같은 addup이라는 화일을 작성한다.
# vi addup
{total=$3+$4+$5+$6;print $0, total, total*$2}
이 작용은 ;에 의해 분리된 두 부분들을 가지고 있다. 첫 부분은 판매수를 합하고 영리하게도 합계를
total이라 부른다. 두번째 부분은 원래의 라인($0)을 프린트하고, 그 뒤에 합계를 , 그 다음에는
total*$2를 프린트하는데, 이것은 합계x두번째 열을 의미한다.
# awk -f addup sales
carts 29.99 45 13 55 22 135 4040.64
corks 0.02 30 20 25 93 93 3.36
doors 49.99 40 15 20 25 100 4999
geese 15.00 2 8 1 128 139 2085
nighties 50.00 11 23 15 82 131 6550
o awk 입력 라인을 읽는 방법
표준 입력이나 화일로부터 읽혀지는 각 라인은 공백문자로 구분된 필드를 가지고 있는 것으로 간주된다.
-F(field)선택자 뒤에 임의의 문자를 입력하면 필드 구분자가 그 문자로 변경된다.
예를 들어 :(콜론)을 구분자로 사용하려면 다음과 같이 입력한다.
# awk -F: -f prog files
o awk의 패턴과 연산
awk가 읽어들이는 라인과 필드들에 대한 작업은 패턴-연산의 쌍으로 정의되며 이쌍은 다음과 같은
형식을 갖는다.
pattern {action}
연산 부분을 중괄호로 둘러쌈으로써 패턴과 구분한다. 연산 부분이 생략되면 그 라인이 프린트된다.
일반적으로 사용되는 연산에는 print가 있으며 이 연산은 인수를 표준 출력에 출력한다.
다음연산은 입력 필드 개의 순서를 바꾸어 출력한다.
{ print $2, $1}
# vi in.file
hello goodbye again
111 222
thirty forty
# vi awk.prog1
{print $2, $1}
# awk -f awk.prog1 in.file
goodbye hello
222 111
forty thirty
위의 예에서 print의 인수는 콤마로 구분되었으며 이로 인해 출력 데이터 사이에 현재의 필드 구분자가
삽입되었다. 콤마가 생략되면 $1과 $2가 연속하여 출력된다.
예를 들어 다음의 awk 프로그램은
# vi awk.prog2
/hello/ {print $2, $1}
# awk -f awk.prog2 in.file --> 입력 화일 내에서 패턴 /hello/과 일치하는 라인은 1개뿐이기
goodbye hello 때문에 그 라인에 대해서만 지정된 연산인 print가 실행되었다.
# vi awk.prog3
/hello/ {print $2, $1}
/thirty/ {print $1, $2, "and more"}
# awk -f awk.prog3 in.file --> print명령어의 인수가 따옴표로 둘러싸여 제공되었으며 그 문자열이
goodbye hello 출력에 표시되었다.
thirty forty and more
# vi awk.prog4
/hello/||/111/ {print "htt", $1, $2}
# awk -f awk.prog4 in.file --> ||연산자는 2개의 정규식 중 하나만 일치하면 지정된 연산을 실행하며
hit hello goodbye &&연산자는 2개의 정규식이 모두 일치애햐 지정 연산을 실행한다.
hit 111 222 !연산자는 정규식이 일치하지 않아야 지정된 연산을 실행하며
정규식 앞에 기술된다.
# vi awk.prog5
/^[Hh1]/ {print "htt", $0}
# awk -f awk.prog5 in.file --> $0을 사용했기 때문에 입력 라인 전체가 출력되었음
hit hello goodbye again Hh1으로 시작하는 line을 출력
hit 111 222
# vi awk.prog6
/hello/ {
print $2
print "another"
print $1
}
# awk -f awk.prog6 in.file --> 패턴 /hello/와 일치하는 첫번째 입력 라인만이 연산의 대상이 됨
goodbye
another
hello
o awk를 이용한 숫자 연산
awk의 산술 연산이 bc의 산술 연산과 다른 점은 awk는 입력 화일 내의 라인 중 일부를 선택하는
패턴 부분을 사용할 수 있다는 것이다.
예를 들어 awk의 내장 함수인 length는 문자열로 취급되는 입력 필드의 길이를 뱐환하며 숫자 변수는
숫자로 취급되는 필드의 값을 할당받을 수 있다.
# vi awk.prog7
{
s += $2
print $2, "length=" length($2), "s=" s
}
# awk -f awk.prog7 in.file --> 숫자로 변환될수 없는 문자열은 값이 0이 된다.
goodbye length=7 s=0 문자열 thirty가 그 예로서, 숫자로 변환될수 없다. 그러나 문자열
222 length=3 s=222 222는 숫자로 올바르게 변환되었다. 또한 s=0과 같은 형식으로 변수에
forth length=5 s=222 값을 할당할 수 있다.
다음은 awk변수의 욜바른 예이다.
s
S
SS
S1
qwerty[42]
변수를 사용하기 전에 선언하거나 초기화시킬 필요는 없다. awk가 자체적으로 변수를 초기화시키며
필요에 따라 그 변수를 문자열이나 숫자를 기억시킬수 있다.
# vi awk.prog8
/hello/ {
SSS=34
print "SSS is", SSS
SSS=hello
print "SSS is", SSS
}
# awk -f awk.prog8 in.file --> 이와 같은 자동적인 변수 형식 변환은 변수의 사용을 수월하게 한다.
SSS is 34
SSS is hello
o 처리를 시작하고 끝내기 위한 특수 패턴
정규식 패턴 외에도 2개의 특수 패턴으로 BEGIN과 END가 사용된다. BEGIN은 첫 번째 입력 라인을
읽기 전에 awk프로그램의 선두에서 실행되며 END는 마지막 입력 라인이 처리된 후 프로그램의 제일
끝에서 실행된다.
BEGIN은 주로 변수 초기화 등의 작업에 사용되며 END는 마지막 계산을 하고 출력을 요약하는 작업에
사용된다. BEGIN이나 END가 없어도 되나 필요한 경우 포함시킬 수 있다.
예를 들어 다음 프로그램은 여러 개 숫자의 평균값을 출력한다.
BEGIN {
print "Beginning to process the input data ..."
}
{
s += $1
n++
}
END {
print "mean of these",n,"data items is", s/n
}
메시지를 프린트하는 BEGIN과 관련된 연산은 프로그램의 선두에서 실행되며 그 후에 각 입력라인이
읽혀진다. 패턴이 생략되었기 때문에 모든 입력 라인에 대해 연산이 실행되었다.
첫 번째 필드를 변수 s에 더하고 1을 증가시키며 마지막의 END패턴은 모든 입력이 처리된 후 실행된다.
이 END 패턴에서는 계산의 최종 결과를 출력하고 있다.
유용한 awk script
리스트중 화일속성과 화일명만 보고자 할때 명령: ls -al | awk '{print $1, $9}'
리스트중 파일크기가 10000 byte 보다 크면 출력하는 명령 : ls -al | awk '$5 > 10000{print $5, $9}'
etc/group 에서 루트권한이 있는 계정을 찾기 awk -F: /root/'{print $1}' /etc/group
[퍼옴]
'개발은 핵찜이야 > 리눅스' 카테고리의 다른 글
서버.. MySql 로그 남기려면.. (0) | 2012.04.13 |
---|---|
파일 용량 특정 위치 찾기 awk (0) | 2012.04.13 |
서버 백업(삭제) 시스템 (크론) (0) | 2012.04.13 |
리눅스 여러계정 한번에 생성 쉘프로그래밍 (0) | 2012.04.13 |
my.cnf(4G이상) 기본 설정 내용 (0) | 2012.04.13 |