Blogspot là một dạng web 2.0 của Google được giới blogger ưa chuộng bởi nhiều tính năng cũng như sự tiện lợi dễ dùng của nó, tuy nhiên cũng vì thế mà nhiều "tệ nạn" xảy ra. Một trong số đó là nạn copy, lấy cắp full data, toàn bộ cơ sở dữ liệu của blog, những bài viết mà bạn phải đầu tư, chăm chút và dành nhiều thơi gian để đăng tải.
Và tất nhiên mình cũng là một nạn nhân chỉ vừa mới hôm qua tính từ thời điểm viết bài này, Nhiều blog không những bị lấy toàn bộ data (dữ liệu), mà còn cả template. Không những thế tên đánh cắp còn pm cả yahoo và nói chuyện với một thái độ rất chi là ngông: "Bạn share luôn template với data đi, khỏi mất công mình đi chôm cho đỡ mệt".
Trước tiên muốn ngăn chặn việc sao chép dữ liệu thì cần phải hiểu cách thức lấy cắp của nó cái đã.
Và tất nhiên mình cũng là một nạn nhân chỉ vừa mới hôm qua tính từ thời điểm viết bài này, Nhiều blog không những bị lấy toàn bộ data (dữ liệu), mà còn cả template. Không những thế tên đánh cắp còn pm cả yahoo và nói chuyện với một thái độ rất chi là ngông: "Bạn share luôn template với data đi, khỏi mất công mình đi chôm cho đỡ mệt".
Trước tiên muốn ngăn chặn việc sao chép dữ liệu thì cần phải hiểu cách thức lấy cắp của nó cái đã.
Cách lấy toàn bộ dữ liệu của một trang blogspot
(Bài viết này mình có tham khảo của bạn Namka, vui lòng xem trích dẫn bên dưới)
Sỡ dĩ có thể lấy cắp toàn bộ dữ liệu của blogspot chính là do 1 tính năng mà blogger cung cấp - RSS - ATOM - Nguồn cấp dữ liệu bài đăng.
Sỡ dĩ có thể lấy cắp toàn bộ dữ liệu của blogspot chính là do 1 tính năng mà blogger cung cấp - RSS - ATOM - Nguồn cấp dữ liệu bài đăng.
Bước 1. Xác định trang blogspot mà bạn muốn lấy dữ liệu
Mình sẽ gọi blog cần lấy dữ liệu là blog nạn nhân.
Ví dụ trang cần lấy là: http://victim.blogspot.com :D
Nguồn cấp dữ liệu bài đăng sẽ là: http://victim.blogspot.com/atom.xml.
Lưu ý: Một vài blogspot tạo Feed, Atom sử dụng công cụ của bên thứ 3, như Blog cuộc sống muôn màu sử dụng feedburner.com.
Ví dụ trang cần lấy là: http://victim.blogspot.com :D
Nguồn cấp dữ liệu bài đăng sẽ là: http://victim.blogspot.com/atom.xml.
Lưu ý: Một vài blogspot tạo Feed, Atom sử dụng công cụ của bên thứ 3, như Blog cuộc sống muôn màu sử dụng feedburner.com.
Bước 2. Xác định tổng số lượng bài viết của blog nạn nhân
Copy toàn bộ đoạn scripts dưới đây:
<script style="text/javascript">
function showpostcount(json) {
document.write('<center>Tổng số bài viết: <b>' + parseInt(json.feed.openSearch$totalResults.$t,10)
+ '</b></center>');}</script>
<script src="http://victim.blogspot.com/feeds/posts/default?alt=json-in-script&callback=showpostcount"></script>
<script style="text/javascript"></script>
Lưu ý: Thay địa chỉ blog của nạn nhân mà bạn muốn lấy.
Vào trang test javascripts tại đây, và dán toàn bộ đoạn scripts mà bạn đã copy ở trên, chọn "Xem trước nhanh" sẽ có được tổng số bài viết tại khung kết quả.
Ví dụ: Sau khi chạy đoạn scripts ta biết được rằng blog nạn nhân có 300 bài. Chuyển sang bước tiếp theo.
<script style="text/javascript">Lưu ý: Thay địa chỉ blog của nạn nhân mà bạn muốn lấy.
function showpostcount(json) {
document.write('<center>Tổng số bài viết: <b>' + parseInt(json.feed.openSearch$totalResults.$t,10)
+ '</b></center>');}</script>
<script src="http://victim.blogspot.com/feeds/posts/default?alt=json-in-script&callback=showpostcount"></script>
<script style="text/javascript"></script>
Vào trang test javascripts tại đây, và dán toàn bộ đoạn scripts mà bạn đã copy ở trên, chọn "Xem trước nhanh" sẽ có được tổng số bài viết tại khung kết quả.
Ví dụ: Sau khi chạy đoạn scripts ta biết được rằng blog nạn nhân có 300 bài. Chuyển sang bước tiếp theo.
Bước 3. Tiến hành lấy toàn bộ dữ liệu về máy
Copy đoạn bên dưới:
http://victim.blogspot.com/atom.xml?redirect=false&start-index=X&max-results=Y
- Thay http://victim.blogspot.com bằng blog của nạn nhân.
- X: Bài bắt đầu lấy, tính từ bài viết mới nhất, bài mới nhất là 1, không có 0 nha.
- Y: Tổng số bài sẽ lấy tính từ X.
Ví dụ: Sau khi xác định được blog nạn nhân có tất cả 300 bài như ở trên, ta làm như sau.
Copy toàn bộ đoạn dưới đây:
http://victim.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=300
http://victim.blogspot.com/atom.xml?redirect=false&start-index=X&max-results=Y- Thay http://victim.blogspot.com bằng blog của nạn nhân.
- X: Bài bắt đầu lấy, tính từ bài viết mới nhất, bài mới nhất là 1, không có 0 nha.
- Y: Tổng số bài sẽ lấy tính từ X.
Ví dụ: Sau khi xác định được blog nạn nhân có tất cả 300 bài như ở trên, ta làm như sau.
Copy toàn bộ đoạn dưới đây:
http://victim.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=300
Lay toan bo du lieu cua blogspot by nhacxinh Copyright @2013
Lay toan bo du lieu cua blogspot by nhacxinh Copyright @2013