Thứ Ba, 10 tháng 11, 2009

Chất độc da cam và ung thư

Hôm nay thấy trên trang Viet-studies.info, Trần Hữu Dũng trân trọng giới thiệu bài báo về “Chất độc da cam và tỷ lệ ung thư của người Việt Nam 30 năm sau chiến tranh” (World Bank 2009) của Đỗ Quý Toàn. Tác giả này chắc không phải Đỗ Quý Toàn trong nhóm truyền thông Bolsa, mà có lẽ chỉ là trùng tên. Đã lâu rồi, tôi không lên tiếng về vấn đề chất độc da cam nữa, vì không có dữ liệu mới và cũng thấy hơi nản lòng với cách làm của các quan chức trong nước. Nhưng ở đây, được một giáo sư kinh tế lớn trên thế giới như bác Dũng khen ngợi và liệt vào “báo cáo đặc biệt” nên tôi phải xem qua cho biết.

Thật ra, bài báo cũng công phu, sử dụng nhiều nguồn số liệu. Nhưng điểm yếu nhất của nghiên cứu này là mang tính “ecologic analysis”, chứ không phải là một công trình nghiên cứu y khoa thực chất, tức là không có bệnh nhân hay đối tượng nghiên cứu. Có vài điều làm tôi thất vọng với nghiên cứu này. Trong entry này tôi chỉ ghi lại vài cảm nhận nhanh thôi, chứ nếu phân tích cho đầy đủ thì cần đến cả chục trang giấy.

Thứ nhất là sử dụng số liệu thiếu chính xác. Trong phần tóm tắt tác giả viết “Trong cuộc chiến tranh Việt Nam, hơn 70 triệu lít chất diệt cỏ quân sự đã được rải xuống vùng chiến sự”, nhưng đến phần mở đầu thì “Trong cuộc chiến tranh Việt Nam (1959-1975), 72 triệu lít chất độc diệt cỏ đã được rải xuống từ năm 1961 đến năm 1971 nhằm làm rụng lá rừng và phá hủy mùa màng”. Cả hai phát biểu hoặc là có vấn đề hoặc là sai. Nếu viết cho báo đại chúng thì cách nói “hơn 70 triệu” có thể chấp nhận được, nhưng viết báo cáo khoa học thì không thể chấp nhận được. “Hơn 70 triệu” có thể là 70.1 triệu, nhưng cũng có thể là 1 tỉ. Con số 72 triệu lít không đúng, vì theo thống kê của nhóm tác giả thuộc Đại học Columbia (mà báo cáo có trích dẫn) thì con số hóa chất khai quang được rải xuống Việt Nam trong thời gian 1961-1971 là 76.9 triệu lít.

Thứ hai là phương pháp phân tích chưa đạt. Tác giả áp dụng mô hình hồi qui logistic để phân tích mối liên hệ giữa các yếu tố nguy cơ đến bệnh ung thư. Có vài vấn đề về áp dụng phương pháp này. Thứ nhất, tỉ lệ ung thư xảy ra rất thấp so với dân số trong cộng đồng (hay như báo cáo này viết là 0.08% -- một tỉ lệ khó tin!) do đó con số ca ung thư không thể nào tuân theo hàm số logistic được, mà rất có thể là tuân theo luật phân phối Poisson. Điều này có nghĩa là giả định về hàm logistic của mô hình phân tích có thể sai lầm. Thứ hai, giả định của mô hình hồi qui logistic là các biến độc lập phải là những biến không có sai số đo lường, và điều này thì hoàn toàn không đúng cho nghiên cứu này, vì chúng ta biết rằng tất cả các biến độc lập như số lượng bom, số lần rải, v.v… đều mang tính bất định. Thứ ba, giả định của mô hình hồi qui logistic là các đối tượng nghiên cứu phải độc lập nhau, nhưng ở đây các đối tượng lại là người trong gia đình, tức là có liên quan nhau, cho nên giả định này cũng sai nốt! Thứ tư, các yếu tố nguy cơ phải độc lập nhau, nhưng giả định này cũng không đáp ứng được bởi vì rất nhiều biến trong phân tích này có liên quan nhau.

Mô hình phân tích chưa đạt là do cách tác giả chưa phân tầng các yếu tố nguy cơ. Ở đây, chúng ta có thể thấy có 3 nhóm yếu tố nguy cơ: nhóm thứ nhất liên quan đến cá nhân (đối tượng nghiên cứu); nhóm thứ hai liên quan đến gia đình; và nhóm thứ 3 liên quan đến các làng xã. Để phân tích rạch ròi ảnh hưởng của 3 nhóm yếu tố nguy cơ này, tác giả cần phải áp dụng các mô hình phân tích đa tầng (hierarchical models), chứ không phải đơn giản như mô hình hồi qui logistic. Dựa vào mô hình logistic đó, tác giả kết luận: “Các kết quả không cho thấy bất kỳ sự khác biệt nào về tỷ lệ ung thư giữa những xã đã từng phơi nhiễm với chất diệt cỏ quân sự với các xã chưa phơi nhiễm bao giờ, trong đó sự phơi nhiễm được tính bằng một trong hai giá trị đo lường nói trên.” Nhưng nếu phương pháp phân tích không tốt (hay nói lịch sự là “chưa đạt”) thì làm sao chúng ta có thể tin vào kết quả này? Nói tóm lại, tôi nghi ngờ về sự thích hợp của phương pháp phân tích, cho nên các kết quả cũng rất khó mà diễn giải cho đến nơi đến chốn được.

Thứ ba là chiến lược phân tích có vấn đề. Đầu tiên, tác giả không tìm thấy (hãy cứ tạm tin là như thế) sự khác biệt nào về tỉ lệ ung thư giữa các xã bị rải độc chất và các xã không bị rải độc chất. Nói cách khác, rải độc chất không có ảnh hưởng đến nguy cơ mắc bệnh ung thư. Ấy thế mà tác giả tiếp tục phân tích mối liên hệ giữa số lần bị rải và nguy cơ ung thư. Đây là chiến lược mà giới thống kê học gọi là “fishing expedition”! Trong bảng 3, biến “số lần bị rải” được phân tích như là một biến gốc, nhưng đến bảng 4 thì lại được hoán chuyển sang đơn vị logarit! Tác giả không giải thích tại sao phải hoán chuyển dữ liệu. Chính vì kiểu “sang số” trong khi phân tích, cho nên các ước số của các yếu tố trong bảng 3 rất khác với bảng 4, và đó là một mối quan tâm.

Thứ tư là cách diễn giải kết quả của tác giả có vẻ quá chủ quan, và mang định kiến rõ ràng. Chẳng hạn như khi không có sự khác biệt nào về tỉ lệ dân số mắc bệnh ung thư giữa các xã bị nhiễm độc và các xã không nhiễm độc, tác giả cho rằng “có thể phản ánh trung thực một sai lệch thống kê”. Nhưng đến khi “nghiên cứu phát hiện rằng trong các xã đã từng bị nhiễm độc trước đây, xã nào phơi nhiễm nhiều hơn có tỷ lệ ung thư (tự khai) cao hơn trong thời gian 2001-2002” thì vội vàng viết là “có thể những phát hiện này thể hiện mối quan hệ nhân quả giữa việc nhiễm chất độc màu da cam và bệnh ung thư”. Thật ra thì một phát hiện như thế rất khó diễn giải, chẳng những vì cách thẩm định/chẩn đoán ung thư có vấn đề, mà còn vì nhiều lí do khác mang tính khoa học. Ở đây, tôi chỉ nêu 2 lí do hiển nhiên nhất. Thứ nhất, đây là nghiên cứu ecologic và cắt ngang, nên hoàn toàn không thể suy luận gì về nguyên nhân và hệ quả (cause-and-effect). Thứ hai, tỉ lệ ung thư là một chỉ số quần thể, trong khi suy luận về nguyên nhân và hệ quả đòi hỏi bằng chứng sinh học cấp cá nhân. Không có số liệu phơi nhiễm cấp cá nhân rất dễ rơi vào cái bẫy của "nghịch lí Simpson" vốn rất phổ biến trong dịch tễ học.

Chẳng những diễn giải kết quả mang tính chủ quan, tôi còn nghi ngờ cách hiểu của tác giả nữa. Chẳng hạn như tác giả bình luận về bảng số liệu 3 như sau “Các kết quả không cho thấy bất kỳ sự khác biệt nào về tỷ lệ ung thư giữa những xã đã từng phơi nhiễm với chất diệt cỏ quân sự với các xã chưa phơi nhiễm bao giờ, trong đó sự phơi nhiễm được tính bằng một trong hai giá trị đo lường nói trên,” nhưng tôi nghĩ câu này không đúng. Bảng số 3 cho thấy hệ số của mô hình logistic liên quan đến “số lần bị rải chất độc trong vòng 15 km trên phân vị 75” là 1.201 với sai số chuẩn (standard error) là 0.290. Nói cách khác, hệ số này cao gấp 4.1 lần so với sai số chuẩn, và chắc chắn phải có ý nghĩa thống kê (tức là trị số P phải thấp hơn 0.001). Thật ra, nói rằng không thấy "bất kỳ sự khác biệt nào" là không đúng, vì sự thật là có khác biệt, nhưng mức độ khác biệt không có ý nghĩa thống kê. Cần phải phân biệt ý nghĩa thống kê và ý nghĩa lâm sàng!

Thứ năm, vấn đề lớn nhất của nghiên cứu này là xem ung thư như là một bệnh, và đó là một sai lầm. Có nhiều (hàng trăm) dạng ung thư, nhưng chỉ có một số được xem là có liên quan đến chất độc da cam. Chẳng hạn như ung thư các mô mềm và ung thư tuyến tiền liệt là những bệnh được xem là có thể liên quan đến chất độc da cam, còn các ung thư khác như ung thư phổi, thận, gan, da, v.v… thì chưa có bằng chứng nào để phát biểu về ảnh hưởng của chất độc da cam. Do đó, gộp chung tất cả ung thư thành một bệnh chẳng những sai lầm về phương pháp mà về mặt lâm sàng chẳng có ý nghĩa gì!

Thứ sáu là vấn đề trình bày dữ liệu. Tôi đoán rằng những ai không hay chưa quen với vấn đề chất độc da cam rất khó theo dõi các dữ liệu trong báo cáo này. Ngay cả tôi là người quen với lĩnh vực này trên 20 năm và cũng biết chút ít về thống kê mà còn phải "vật lộn" để hiểu các bảng số liệu nói gì, nhưng vẫn không chắc là mình hiểu. Chẳng hạn như hệ số liên quan đến giới tính trong bảng số 3 là 0.652, nhưng con số này có nghĩa gì? Có phải nguy cơ ung thư ở nam giới cao gấp exp(0.652) = 1.91 lần so với nữ? Hay như hệ số liên quan đến "tuổi bình phương" trong bảng 4 là 0.998, nhưng tuổi bình phương là tuổi gì và con số đó có nghĩa là gì? Tôi đoán tuổi bình phương là tuổi nhân cho tuổi. Con số này có thể có ý nghĩa toán học nào đó, nhưng trong y khoa nó hoàn toàn vô nghĩa. Điều đáng tiếc là tác giả không giải thích gì về những hệ số này có ý nghĩa gì!

Mặc dù phía dưới bảng tác giả đề rằng đây là những "tỷ số chênh" (tức odds ratio), nhưng odds ratio thì làm gì có sai số chuẩn? Và, nếu thật sự là odds ratio, thì hệ số trong bảng 4 có nghĩa là những làng xã từng bị rải các loại độc chất có tỉ lệ ung thư thấp hơn các làng xã không bị rải (và có ý nghĩa thốngkê)!!!

Thứ bảy là vấn đề tài liệu tham khảo. Tác giả có xu hướng trích dẫn nhiều nghiên cứu của các tác giả ngoại quốc (và điều này thì cũng có thể hiểu được), nhưng không trích dẫn một công trình quan trọng của tác giả Ngô Đức Anh trên tập san International Journal of Epidemiology vào năm 2006! Có lẽ bụt nhà không thiêng chăng?

Tác giả đổ thừa cho cái nghèo dẫn đến tình trạng Việt Nam không có những dữ liệu khoa học như Mĩ. Tác giả viết “Rất đáng tiếc là ở Việt Nam, với mức thu nhập bình quân đầu người tính theo ngang bằng sức mua chỉ khoảng 2,000 USD năm 2007, không có một tài liệu với mức độ đầy đủ và tin cậy như các nghiên cứu ở Mỹ, nơi mà thu nhập bình quân đầu người là 45.800 USD (theo CIA, 2008).” Nhưng tôi nghi ngờ điều này. Đúng là cái nghèo là một trong những lí do chúng ta không có khả năng làm nghiên cứu qui mô như Mĩ, nhưng đó không phải là nguyên nhân duy nhất. Theo tôi thấy, chúng ta vẫn có thể làm những nghiên cứu có giá trị khoa học cao mà không cần đến GDP bình quân của dân số phải như Mĩ hay một nước tiên tiến. Điều này tôi đã chỉ ra trong nhiều bình luận trước đây nên thiết tưởng không cần lặp lại ở đây. Vấn đề là chúng ta có quyết tâm làm hay không. Cách đây không lâu, báo Tuổi Trẻ phát động một phong trào yểm trợ nạn nhân chất độc da cam và vận động được hơn 1 tỉ đồng cho nghiên cứu khoa học, nhưng cho đến nay chẳng ai biết số tiền đó dành cho nghiên cứu gì, và kết quả đã công bố ở đâu!

Nói tóm lại, tôi thấy phân tích của tác giả Đỗ Quý Toàn thể hiện một đóng góp có ý nghĩa cho cuộc đấu tranh đòi công lí cho nạn nhân chất độc da cam ở nước ta. Nhưng rất tiếc là phân tích này còn nhiều khiếm khuyết về phương pháp và cách diễn giải, nên tính thuyết phục của kết quả còn thấp. Nếu được, tôi đề nghị tác giả có thể phân tích lại và viết một bài bằng tiếng Anh để gửi cho các tập san y tế công cộng có uy tín trên thế giới để công bố. Chúng ta cần nhiều nghiên cứu như thế nữa xuất hiện trên các diễn đàn y khoa quốc tế, và tôi không tiếc thời gian để góp mộ tay.

NVT

0 nhận xét:

Đăng nhận xét