Khám Phá Command-Line trên Linux Phần 3: Xử lý text bằng filter trong Linux (cat, join, paste, sort, head, tail, wc)

Nội dung

Phần 3: Xử lý text bằng filter trong Linux

1.1. Lệnh combine file

CAT

Giả sử ta có 2 file text chứa nội dung và giờ ta muống gộp nội dung 2 files vào chung 1 file. Ta sẽ làm điều đó với lệnh cat ( concatenate)

file1.txt

text from file1

file2.txt

text from file2

$ cat file1.txt file2.txt > file3.txt

file3.txt

text from file1

text from file2

Ta còn có thể dùng cat như một lệnh để đọc file có nội dung vừa phải như sau:

$ cat file3.txt

Lệnh tac tương tự với lệnh cat nhưng hiển thị ngược lại về trình tự nội dung file. Ví dụ:

$ cat file3.txt

file3.txt

text from file2

text from file1

Tuy nhiên với các file chứa nhiều nội dung thì ta nên dùng lệnh more hoặc less để xem. Lệnh cat có nhiều option khác nhau đễ hỗ trợ ta thay đổi đôi chút text file khi tiến hành nối file:

  • Nếu ta muốn xem dòng kết thúc ở đâu ta sử dụng option -E (end), hệ thống sẽ thêm ký hiệu $ vào mỗi cuối dòng.

  • Đánh số mỗi dòng với option -n (number line), option -b (nonblank) cũng có chức năng tương tự những dòng trống sẽ không được đánh dấu.

  • Gộp nhiều dòng trống lại thành 1 dòng trống duy nhất với option -s

** list1.txt**

Andy 1992

Bob 1995

Jane 1998

** list2.txt**

Andy fireman

Bob cop

Jane student

JOIN

Lệnh cat giúp ta nối file theo vertival (hàng dọc), lệnh join thì ngược lại giúp ta nối file theo horizon (hàng ngang)

$ join list1.txt list2.txt

Mặc định join dùng field đầu tiên làm key để ghép 2 file lại với nhau.

PASTE

Lệnh paste dùng để nối dòng với dòng, cách nhau bởi TAB, và không gộp chung key như join.

$ paste list1.txt list2.txt


1.2. Lệnh transform file

Transforming file không nhắm đến thay đổi nội dung file mà thay đổi nội dung được xuất ra stdout để pipe đến 1 program khác.

SORT

$ sort -k 2 list2.txt

Sort hỗ trợ ta loại bỏ các text trùng lặp (duplicate) với optiopn uniq:


1.3. Lệnh format file

Giả sử ta muống định dạng file name profie được đánh số mỗi dòng và có dấu cách ở mỗi dòng, ta làm như sau:

$ cat -n /etc/profile | pr -d


1.4. Lệnh view file

HEAD

Xem nhanh 5 dòng đầu tiên với lệnh head:

$ cat /etc/profile | head -n 5 > file1.txt

TAIL

Xem nhanh 5 dòng cuối với lệnh tail:

$ cat /etc/profile | tail -n 5 > file1.txt

Xem nội dung file với lệnh less, lệnh less thực chất được cải tiến từ lệnh more, các developer đùa rằng less is more.

$ less /etc/securetty

Các phím thao tác trong khi mở file với less:

  • SPACE BAR: để qua một trang khác
  • ESC + V: để lùi lại một trang
  • /<keyword> : để tìm kiếm theo từ khóa (case sensitive), nhấn n để di chuyển con trỏ đến kết quả tìm kiếm tiếp theo.
  • g<line number>: để đi đến dòng mình muốn.
  • q: để thoát khoải chương trình

1.5. Lệnh sumarize file

CUT

Trích xuất đoạn text mong muống với lệnh cut. Ví dụ ta muốn trích xuất mac address của card mạng eth0 như trong hình sau:

Ta sẽ sử dụng câu lệnh sau:

Ở đây ta giới hạn dòng mong muốn với lệnh grepkèm keyword, sau đó dùng lệnh cut với option -d ” “để hệ thống nhận biết các từ phân cách với nhau bởi khoảng trắng và -f để chỉ field mà ta mong muốn cut ra từ đó (nằm ở dấu khoảng trắng thứ 11 từ trái sang phải).

WC

Đếm số dòng, số từ, số byte của 1 file với lệnh wc(word count):

  • số dòng: 400
  • số từ 606
  • số byte: 4038 bytes

Vậy là chúng ta lại kết thúc một phần nữa, các bạn hãy thực hành trên terminal để hiểu và nhớ nhé. Nếu có thắc mắc gì hãy comment dưới post của mình nhé. Chúc các bạn thành công.

Nguồn: Viblo

Anthony Nguyễn

Cây bút chính tại VietnamTutor

Bài viết cùng chuyên mục

Nâng Cấp Laravel 13: Checklist 10 Bước Không Thể Bỏ Qua 2026

Hướng dẫn nâng cấp Laravel 13 chi tiết với checklist 10 bước. Từ kiểm tra PHP 8.3, cập nhật dependencies, đến xử lý lỗi thường gặp

Hardening Laravel Production: Checklist Bảo Mật Toàn Diện 2026

Checklist hardening Laravel production toàn diện. Từ cấu hình server, database, SSL đến security headers, rate limiting và monitoring.

Authentication & Authorization Trong Laravel: Hướng Dẫn A-Z 2026

Hướng dẫn chi tiết cách xây dựng hệ thống Authentication (xác thực) và Authorization (phân quyền) trong Laravel với Breeze, Fortify, Sanctum, Policies và Gates.

Bảo Mật Laravel: 10 Lỗi Phổ Biến & Cách Phòng 2026

Hướng dẫn 10 lỗi bảo mật phổ biến nhất trong Laravel và cách phòng tránh hiệu quả. Từ XSS, SQL injection đến authentication vulnerabilities.

Migration PHP Attributes Laravel 13: Hướng Dẫn Chi Tiết

Cách chuyển đổi từ protected properties sang PHP Attributes trong Laravel 13 với hướng dẫn từng bước và code examples chi tiết.

Laravel 13 Có Gì Mới? Tổng Hợp Tính Năng Mới 2026

Laravel 13 ra mắt ngày 17/3/2026 với PHP 8.3, PHP Attributes, AI SDK và nhiều cải tiến. Khám phá chi tiết các tính năng mới của

Kubernetes for Beginners 2026: Hướng Dẫn Từ A-Z

Kubernetes (K8s) là nền tảng container orchestration phổ biến nhất hiện nay. Bài hướng dẫn này sẽ giúp bạn hiểu Kubernetes là gì, kiến trúc cơ

Docker Compose Best Practices 2026: 10 Tips Quan Trọng

Docker Compose giúp bạn quản lý multi-container applications dễ dàng hơn. Bài viết này tổng hợp 10 best practices quan trọng nhất để sử dụng Docker

Lỗ hổng RCE (CVE-2025-55182) trên React, Next.js?

Cảnh báo khẩn cấp: React2Shell (CVE-2025-55182) gây RCE nghiêm trọng cho React/Next.js. Nắm cơ chế, dấu hiệu & phòng thủ cấp bách để bảo vệ ứng

Dead-Letter Queue: Giải pháp cứu cánh cho tin nhắn lỗi hệ thống

DLQ là chìa khóa quản lý tin nhắn lỗi hiệu quả trong hệ thống phân tán. Đảm bảo tin nhắn không bị mất, tăng độ tin

Lập trình viên: Xây doanh nghiệp một người, kiếm 10.000 USD/tháng

Lập trình viên: Khám phá khung làm việc để xây dựng doanh nghiệp một người, kiếm 10.000 USD/tháng. Biến kỹ năng code thành cỗ máy tiền,