Tìm hiểu về Elasticsearch
Elasticsearch là gì?
Elasticsearch là một công cụ tìm kiếm và phân tích phân tán được xây dựng dựa trên nền tảng của Apache Lucene. Kể từ khi ra mắt năm 2010 đến nay, Elasticsearch đã nhanh chóng trở thành một công cụ tìm kiếm vô cùng thông dụng và được dùng rộng rãi trong hầu hết các công việc liên quan đến: tìm kiếm toàn văn bản – Full Text Search, thông tin bảo mật nghiệp vụ cũng như các thông tin vận hành.
Tino Group sẽ tóm tắt các thông tin về Elasticsearch một cách ngắn gọn để bạn dễ năm hơn:
- Elasticsearch là một công cụ tìm kiếm – search engine
- Được phát triển và kế thừa dựa trên nền tảng Apache Lucene
- Elasticsearch là một dự án mã nguồn mở được xây dựng bằng ngôn ngữ Java
- Elasticsearch không phụ thuộc vào ngôn ngữ xây dựng client hay server của bạn mà chạy trên server riêng và giao tiếp dựa thông qua RESTful.
Thông tin mới nhất vào ngày 21/1/2021, Elastic NV có thông báo chính thức rằng sẽ không phát hành phiên bản Elasticsearch và Kibana theo giấy phép Apache ALv2 nữa. Đồng nghĩa với việc Elasticsearch và Kibana sẽ được phát hành dưới dạng mã nguồn đóng.
Nếu bạn muốn sử dụng các phiên bản mới nhất của Elasticsearch và Kibana, bạn sẽ phải mua giấy phép Elastic hoặc SSPL. Với mỗi gói khác nhau, bạn sẽ có các quyền sử dụng khác nhau.
Trong trường hợp bạn muốn tiếp tục sử dụng Elasticsearch và Kibana miễn phí, bạn có thể tìm hiểu về dự án OpenSearch của AWS được phát triển dựa trên giấy phép ALv2.
Ứng dụng của Elasticsearch là gì?
Với lợi thế tốc độ và khả năng mở rộng mạnh mẽ, Elasticsearch có thể hỗ trợ lập index nhiều nội dung khác nhau, sử dụng trong nhiều trường hợp, ví dụ như:
- Tìm kiếm trong doanh nghiệp
- Tìm kiếm trong web
- Tìm kiếm trong ứng dụng
- Sử dụng vào ghi nhật ký và phân tích nhật ký
- Sử dụng để đo lượng, giám sát hiệu suất của ứng dụng
- Phân tính bảo mật
- Phân tích doanh nghiệp
- Đo lường các chỉ số về cơ sở hạ tầng cũng như hỗ trợ giám sát các container
- …
Lợi ích của Elasticsearch mang lại là gì?
Dễ dàng triển khai với tốc độ nhanh
Elasticsearch cung cấp một giao diện HTTP tối giản cùng REST đơn giản dựa trên API và sử dụng JSON không có schema. Tất cả những điều này giúp bạn có thể tạo ra một ứng dụng với tốc độ nhanh chóng, tiết kiệm thời gian và có thể sử dụng trong nhiều trường hợp khác nhau.
Hoạt động trong thời gian thực
Elasticsearch chỉ mất hơn 1 giây để có thể đọc hoặc ghi những dữ liệu thông thường. Nếu bạn đang cần phát triển một ứng dụng, phần mềm hoạt động theo thời gian thực, Elasticsearch sẽ có thể đáp ứng gần như trong thời gian thực và hỗ trợ giám sát những điều bất thường.
Hiệu năng cao
Elasticsearch có bản chất phân tán. Vì thế, Elasticsearch có thể xử lý cùng lúc, song song một khối lượng công việc, dữ liệu lớn và nhanh chóng tìm ra được những kết quả phù hợp với các truy vấn của bạn.
Rất nhiều công cụ và plugin bổ sung chức năng
Bộ đôi Elasticsearch và Kibana được tích hợp với nhau, cho phép bạn có thể xem được các báo cáo về tìm kiếm một cách trực quan nhất. Không chỉ vậy, Elasticsearch còn có thể kết hợp với Beats, Logstash, đồng thời hỗ trợ bạn dễ dàng chuyển đổi nguồn dữ liệu đầu vào và tải vào cluster.
Ngoài ra, bạn có thể sử dụng rất nhiều sản phẩm, plugin mã nguồn mở khác được phát triển dành riêng cho Elasticsearch để đa dạng hóa chức năng, hỗ trợ bạn thực hiện công việc trên giao diện trực quan và nhanh chóng hơn.
Dễ dàng phát triển ứng dụng
Để phát triển một ứng dụng cho thời điểm hiện tại, bạn sẽ cần phải biết được nhiều ngôn ngữ lập trình khác nhau để có thể khai thác tối đa khả năng mà ngôn ngữ mang lại, phần mềm, công nghệ bạn sử dụng sẽ cần phải hỗ trợ những ngôn ngữ đó. Và Elasticsearch hỗ trợ sẵn rất nhiều ngôn ngữ lập trình phổ biến như: Java, Python, PHP, JavaScript, Node.js, Ruby và rất nhiều ngôn ngữ lập trình khác.
Ưu điểm và nhược điểm của Elasticsearch
Ưu điểm của Elasticsearch
- Làm một công cụ được phát triển dựa trên nền tảng Apache Lucene xử lý dữ liệu mạnh mẽ gần với thời gian thực – near-real time
- Không chỉ tìm kiếm dữ liệu, Elasticsearch còn hỗ trợ phân tích dữ liệu
- Khả năng mở rộng rất mạnh mẽ và tuyệt vời
- Hỗ trợ nhiều ngôn ngữ lập trình khác nhau cho các lập trình viên trở nên thoải mái hơn
- Hỗ trợ Structured Query DSL để cung cấp các đặc tả cho những truy vấn phức tạp một cách rõ ràng và cụ thể bằng JSON.
- Có thể tìm kiếm bằng nhiều loại ngôn ngữ khác nhau.
Nhược điểm của Elasticsearch
Không phải là một công cụ toàn năng, vì thế, Elasticsearch cũng có một số nhược điểm đáng chú ý. Khi sử dụng, bạn nên chú ý một số điểm như:
- Elasticsearch được thiết kế cho mục đích tìm kiếm là chính. Do đó, đối với những nhiệm vụ, chức năng khác, Elasticsearch sẽ đáp ứng kém hơn so với những phần mềm, công cụ chuyên dụng khác.
- Đối với một số truy vấn nặng, độ trễ của Elasticsearch sẽ tăng rất nhiều lần.
- Để khai thác được chức năng của Elasticsearch một cách tối ưu nhất, bạn sẽ cần:
- Có rất nhiều kiến thức chuyên môn
- Thông thạo ngôn ngữ lập trình Java
- Một trong những điểm đáng lưu tâm khác: Elasticsearch không có khái niệm database transaction. Vì thế, tính toàn vẹn của dữ liệu sẽ không được đảm bảo và bạn không nên sử dụng vào database chính của mình.
- Nếu ứng dụng, hệ thống của bạn cần phải thường xuyên cập nhật dữ liệu, Elasticsearch sẽ bộc lộ nhược điểm gây tốn kém tài nguyên cho việc index dữ liệu.