Gần đây vnthuquan đã thay đổi giao diện và mã lệnh truy cập khiến cho các phần mềm tự động tải truyện hiện có đều bó tay. Tuy nhiên, về CSDL cơ bản chưa có gì thay đổi.

Khi tải bất kỳ trang nào từ vnthuquan với địa chỉ dạng tương tự như: http://vnthuquan.net/truyen/truyen.aspx?tid=2qtqv3m3237nvntn3n0nmn31n343tq83a3q3m3237nvn ,

hoặc: http://vnthuquan.net/truyen/truyen.aspx?tid=2qtqv3m3237nvntn3n0nmn31n343tq83a3q3m3237nvn#phandau ,

sẽ thu được trang .html chứa một đống nhì nhằng gì đó, nhưng không hề có một chút gì nội dung của cuốn sách mà ta muốn xem. Trang này gọi là trang vỏ PC.

Trang này có một vài điểm cần lưu ý là:

- Thứ nhất, đoạn Có trong mọi trang vỏ PC, chúng chỉ khác nhau ở con số đi sau cụm “tuaid=”.

- Thứ hai, đoạn xem Bằng bản Mobil cho biết địa chỉ trang để đọc trên mobile (căn cứ vào chỉ dẫn “xem Bằng bản Mobil”). Nhấn phải chuột trên cụm từ này trên trình duyệt để sao chép sẽ thu được địa chỉ sau: http://vnthuquan.net/truyen/truyentext.aspx?tid=2qtqv3m3237nvntn3n0nmn31n343tq83a3q3m3237nvn , nhấn trái sẽ làm xuất hiện trang mới trên trình duyệt và trang này là trang dành cho mobile. Trang này gọi là trang vỏ mobile, vì khi tải về nó cũng không chứa nội dung truyện, cũng chỉ toàn những thứ nhì nhằng.

- Thứ ba, đoạn
tồn tại trên tất cả các trang vỏ PC. Điểm khác biệt là ở chỗ đối với sách nhiều chương thì có thêm các đoạn sau:
Con số đi sau cụm “chuongid=” cho biết số hiệu chương. Cụm thẻ a cho biết tên chương: “Lời giới thiệu”.

Như vậy, từ trang vỏ PC, chúng ta có tiếp trang vỏ mobile. Hãy phân tích trang vỏ mobile.

Cũng vậy thôi, tưởng là tránh được vỏ dưa thì lại gặp phải vỏ dừa, may mà không phải là vỏ ốc.

Trang này thu lượm được một vài điều đáng để ý như sau:

- Thứ nhất, đoạn

Trinh Thám, Hình Sự
Thời Khắc Định Mệnh
Agatha Christie

cho biết khá đầy đủ về tên thể loại, tên truyện, tên tác giả.

- Thứ hai, đoạn Hay quá!... Anh không phải là Điệp. Anh là dân xòe quạt, cuối đời lại gặp Lan.

Đúng là chó vớ được *** thuyền chài rồi!

Thế “noidung.aspx” là CLGT?

Đốt đuốc đi từ sáng cho đến lúc mặt trời lặn thì cũng phải tóm được con ếch hai chân, bốn mươi lăm cân chứ. Thế ngộ nhỡ nó tám mươi cân thì làm thế nào?!

Không! Không! Anh ơi! Em là áo trắng, chân dài, sáu mươi hai cân không lẻ.

Tiếp theo, nó còn một vài đoạn như thứ này:
  • Lời giới thiệu
  • Số lượng các đoạn này thì tương đương với số chương trong truyện.

    Sách có 1 chương thì chẳng có đoạn nào như thế cả.

    Đem ghép cụm noidung.aspx?tid=2qtqv3m3237nvntn3n0nmn31n343tq83a3q3m3237nvn với cụm http://vnthuquan.net/truyen/ rồi tải về sẽ thu được trang nội dung của truyện tương ứng với số hiệu chương. Đây là chương 1.

    Thực tế thì đó là chương đầu tiên của truyện, chứa thông tin cần thiết cho việc đóng gói eBook, đó là ảnh bìa:


    Sách không có ảnh bìa thì không có đoạn này.

    Các chương tiếp theo cũng không có đoạn này.

    Và nội dung phần Text của chương.

    Tóm lại:

    Để tải về và đóng gói eBook 1 truyện từ vnthuquan cần làm như sau:

    1. Tải trang vỏ PC: lấy ra địa chỉ trang vỏ mobile;

    2. Tải trang vỏ mobile: lấy ra địa chỉ trang nội dung;

    3. Tải trang nội dung.

    4. Lọc và ghép các trang nội dung, ảnh bìa, tổ chức lại cho thuận tiện để làm nguồn đóng gói eBook.

    5. Đóng gói eBook.

    Chúc mọi người thành công!

     

    Các chủ đề có liên quan khác

    Top