Học Neural SDE từ Đầu

Neural SDE từ con số 0

1/5

Phần 1

Để mạng nơ-ron tự học SDE

Mọi mô hình bạn đã thấy cho đến nay -- Black-Scholes, Heston, SABR -- đều bắt đầu từ một phương trình do con người chọn. Bạn chọn SDE, rồi khớp vài tham số. Neural SDE đảo ngược kịch bản: để một mạng nơ-ron tự học phương trình từ dữ liệu.

Quy trình cổ điển là: con người viết ra dS = f(S,t)·dW with a specific f (like σ·S, orσ·Sᵝ, hoặc thứ gì đó liên quan đến biến động ngẫu nhiên). Sau đó bạn hiệu chỉnh 3-5 tham số theo dữ liệu thị trường.

Quy trình của neural SDE là: drift μ(S,t) và hệ số khuếch tán σ(S,t) là đầu ra của một mạng nơ-ron. Mạng có hàng nghìn tham số (trọng số và bias). Bạn huấn luyện nó bằng cách tối thiểu hóa sai số giữa giá mô hình và giá quyền chọn quan sát được.

Neural SDE

dX = μₕ(X, t)·dt + σₕ(X, t)·dW

μₕ and σₕ là các mạng nơ-ron với tham số θ. Chúng nhận trạng thái hiện tại X và thời gian t làm đầu vào, và xuất ra drift cùng hệ số khuếch tán tức thời.

Mô hình tư duy

Mô hình hóa cổ điển giống như chọn một công thức nấu ăn rồi chỉnh nhiệt độ lò. Mô hình hóa bằng neural SDE giống như dạy một đầu bếp tự sáng tạo công thức bằng cách nếm hàng nghìn món ăn (giá quan sát được) và điều chỉnh cho đến khi kết quả khớp với những gì thị trường đưa ra.

Tại sao phải làm vậy? Vì đôi khi không họ mô hình chuẩn nào khớp dữ liệu đủ tốt. Động lực thị trường có thể có những đặc điểm -- chuyển đổi chế độ, cụm biến động bất đối xứng, hành vi phụ thuộc đường đi -- mà không mô hình năm tham số nào nắm bắt được. Về nguyên tắc, một neural SDE có thể xấp xỉ bất kỳ hàm drift và khuếch tán liên tục nào. Câu hỏi là bạn có đủ dữ liệu và kỷ luật để huấn luyện nó một cách đáng tin cậy hay không.

Phần 2

Kiến trúc

Mạng là một kiến trúc feedforward tiêu chuẩn. Đầu vào là trạng thái thị trường hiện tại. Đầu ra là các hệ số của SDE. Mạng CHÍNH LÀ mô hình.

Đầu vào: Giá giao ngay S, thời gian t, và tùy chọn các đặc trưng thị trường như biến động ngụ ý hiện tại, độ dốc skew, hoặc hình dạng cấu trúc kỳ hạn. Đầu vào càng phong phú, mạng càng có nhiều ngữ cảnh để quyết định σ nên là bao nhiêu tại điểm này.

Các lớp ẩn: Thường 2-4 lớp, mỗi lớp 32-128 nơ-ron. Hàm kích hoạt ReLU hoặc softplus. Không có gì kỳ lạ. Điều kỳ diệu không nằm ở kiến trúc; nó nằm ở những gì mạng học cách biểu diễn.

Đầu ra: Drift μ(S,t) và hệ số khuếch tán σ(S,t). Đầu ra khuếch tán được đưa qua hàm softplus hoặc hàm mũ để đảm bảo luôn dương. Hai con số này, được tính tại trạng thái hiện tại, xác định SDE làm gì tại thời điểm này.

Kiến trúc Neural SDE

Trạng thái thị trường (S, t, features) đi vào từ bên trái. Các lớp ẩn với hàm kích hoạt phi tuyến biến đổi nó. Lớp đầu ra tạo ra hệ số drift tức thời μ và hệ số khuếch tán σ -- hai hàm xác định SDE đã học. Di chuột để làm nổi bật các lớp.

Huấn luyện: Sinh các đường đi từ neural SDE bằng phép rời rạc hóa Euler-Maruyama. Định giá quyền chọn dọc theo các đường đi đó bằng Monte Carlo. So sánh giá mô hình với giá thị trường quan sát được. Lan truyền ngược sai số định giá qua quá trình mô phỏng đường đi vào các trọng số của mạng. Đây là lập trình khả vi áp dụng cho các quá trình ngẫu nhiên.

Điểm kỹ thuật then chốt: toàn bộ chuỗi xử lý -- từ trọng số mạng đến hệ số SDE, đến các đường đi mô phỏng, đến giá quyền chọn -- đều khả vi. Bạn có thể tính gradient của hàm mất mát định giá theo từng trọng số trong mạng. Đó là điều khiến việc huấn luyện trở nên khả thi.

Phần 3

Deep hedging

Khi đã có một SDE được học cho động lực giá, bước tự nhiên tiếp theo là học luôn cả cách hedge. Deep hedging dùng một mạng thứ hai để xuất ra tỷ lệ hedge tại mỗi bước thời gian, được huấn luyện đồng thời với mô hình định giá.

Phòng hộ cổ điển tính delta từ mô hình theo cách giải tích: ∂C/∂S theo BS, hoặc xấp xỉ số với các mô hình phức tạp hơn. Cách này bỏ qua chi phí giao dịch, tác động thị trường, tái cân bằng rời rạc và các ràng buộc thanh khoản.

Deep hedging nói rằng: hãy huấn luyện một mạng để xuất ra tỷ lệ hedge δ(S, t, danh mục) tại mỗi bước thời gian. Mục tiêu huấn luyện không phải là tối thiểu hóa sai số bám theo delta lý thuyết. Mà là tối thiểu hóa phương sai P&L phòng hộ thực tế (hoặc CVaR, hoặc bất kỳ thước đo rủi ro nào) bao gồm cả chi phí giao dịch.

Hàm mục tiêu của deep hedging

minₕ Risk[ PnL(V₀, δₕ, costs) ]

Mạng δₕ xuất ra tỷ lệ hedge tại mỗi bước tái cân bằng. Hàm mục tiêu bao gồm chi phí giao dịch thực tế, không chỉ sai số bám theo lý thuyết.

Kết quả: một chiến lược phòng hộ nhận biết được các ma sát thực tế mà delta cổ điển bỏ qua. Trong backtest, các chiến lược deep hedging thường cho chi phí phòng hộ thực hiện thấp hơn delta dựa trên mô hình, đặc biệt với:

1. Chế độ chi phí giao dịch cao. Mạng học cách hedge ít thường xuyên hơn khi chi phí cao, thực chất là chọn một dải không-giao-dịch rộng hơn.

2. Tài sản cơ sở kém thanh khoản. Mạng học cách dùng các công cụ thanh khoản có tương quan làm hedge thay thế khi hedge trực tiếp quá tốn kém.

3. Quyền chọn exotic phụ thuộc đường đi. Nơi không tồn tại công thức delta đơn giản, mạng vẫn có thể học các cách hedge hiệu quả từ các đường đi mô phỏng.

Góc nhìn về học đồng thời

Phiên bản mạnh nhất huấn luyện đồng thời SDE định giá và mạng hedging. SDE học động lực nhất quán với giá quan sát được, còn mạng hedging học cách hedge theo động lực đó. Hai mạng điều chuẩn lẫn nhau: SDE không thể học động lực phi thực tế vì mạng hedging sẽ hoạt động kém, và ngược lại.

Phần 4

Mạng khám phá được gì

Khi bạn xem xét hàm σ(S,t) đã học, nó thường trông giống local vol với các đặc điểm ngẫu nhiên. Mạng tự khám phá ra những cấu trúc mà con người đã mất hàng thập kỷ để thiết kế.

Huấn luyện một neural SDE trên dữ liệu quyền chọn cổ phiếu hoặc crypto rồi vẽ hàm khuếch tán đã học σ(S,t) dưới dạng heatmap. Các phát hiện điển hình:

Hiệu ứng đòn bẩy. Mạng học được rằng σ(S,t) cao hơn khi S thấp và thấp hơn khi S cao. Đây chính xác là cơ chế mà Heston nắm bắt bằng ρ âm, và CEV nắm bắt bằng β < 1. Mạng không hề biết về các mô hình này. Nó tự tìm ra quy luật từ dữ liệu.

Hồi quy về trung bình của vol. Hàm σ đã học thường tăng cao sau các biến động lớn gần đây và hồi quy về mức cơ sở. Mạng đã tự khám phá ra tính hồi quy trung bình kiểu CIR mà Heston mã hóa cứng.

Cụm biến động (vol clustering). Mạng học được rằng các trạng thái vol cao có tính bền vững -- σ(S,t) duy trì ở mức cao một thời gian sau cú tăng đột biến. Đây là hiện tượng cụm kiểu GARCH mà giới thực hành biết rõ nhưng các mô hình stochastic vol đơn giản khó nắm bắt.

Những gì mạng khám phá được

Vol rises as price falls -- the network learned the classic equity/crypto pattern

Hãy chuyển đổi giữa ba mẫu hình trên. Mỗi mẫu đại diện cho những gì một neural SDE huấn luyện trên các chế độ dữ liệu khác nhau có thể khám phá. Vấn đề không phải là mạng thông minh hơn Heston hay SABR. Vấn đề là nó đi đến các cấu trúc tương tự mà không hề được chỉ dẫn phải tìm chúng. Đó là bằng chứng mạnh mẽ rằng các cấu trúc đó là đặc điểm thực của dữ liệu, không phải sản phẩm phụ của họ mô hình.

Mặt trái: mạng cũng có thể khám phá ra các mẫu hình giả nếu dữ liệu nhiễu hoặc quá trình huấn luyện thiếu kỷ luật. Một mạng lớn huấn luyện trên dữ liệu mỏng sẽ overfit hoàn hảo -- nó sẽ ghi nhớ nhiễu và gọi đó là cấu trúc.

Phần 5

Cân nhắc thực tiễn

Neural SDE mạnh mẽ nhưng đòi hỏi cao. Khoảng cách giữa một bài báo nghiên cứu và một hệ thống sản xuất là rất lớn. Hãy hiểu rõ cái giá phải trả trước khi cam kết.

Hội tụ huấn luyện

Epoch: 0Mất mát: 2.133Giai đoạn: Giảm nhanh

Nhấn Train ở trên và quan sát hàm mất mát hội tụ. Chú ý ba giai đoạn: giảm nhanh ban đầu (mạng học cấu trúc tổng thể), tinh chỉnh chậm hơn (điều chỉnh các cánh và đuôi), và giai đoạn bão hòa (lợi ích giảm dần, tiềm ẩn rủi ro overfitting).

Yêu cầu về dữ liệu huấn luyện. Bạn cần đủ dữ liệu giá quyền chọn để ràng buộc một hàm nhiều chiều. Với một tài sản cơ sở duy nhất, điều đó nghĩa là nhiều tháng hoặc nhiều năm ảnh chụp smile hàng ngày trên nhiều ngày đáo hạn. Dữ liệu thưa (ít giá strike, ít ngày đáo hạn) dẫn đến mạng bị thiếu ràng buộc và overfit.

Rủi ro overfitting. Một mạng nơ-ron với 10.000 tham số có thể ghi nhớ hoàn hảo 10.000 điểm dữ liệu. Điều đó không có nghĩa là nó đã học được động lực. Điều chuẩn (dropout, weight decay, early stopping) là thiết yếu. Kiểm chứng trên dữ liệu để riêng là điều bắt buộc.

Khả năng diễn giải. Một mô hình Heston năm tham số kể cho bạn một câu chuyện: kappa nói điều này, rho nói điều kia. Một neural SDE là hộp đen với 10.000 tham số. Bạn có thể xem xét hàm đã học (như heatmap ở trên), nhưng không thể chỉ vào một con số và nói "đó là tốc độ hồi quy trung bình". Với một bàn giao dịch cần giải thích mô hình cho bộ phận quản lý rủi ro, đây là nhược điểm nghiêm trọng.

Chi phí tính toán. Huấn luyện đòi hỏi hàng nghìn lượt chạy tiến qua SDE (các đường đi Monte Carlo), mỗi lượt cần lan truyền ngược qua mạng tại mỗi bước thời gian. Chi phí này lớn hơn nhiều bậc so với việc hiệu chỉnh Heston hay SABR. Suy luận (định giá một quyền chọn với mô hình đã huấn luyện) thì nhanh, nhưng hiệu chỉnh lại thì chậm.

Mức độ ứng dụng hiện tại. Neural SDE và deep hedging được dùng trong nghiên cứu và bởi các quỹ phòng hộ định lượng có đủ hạ tầng hỗ trợ. Chúng chưa phải là chuẩn mực trên các bàn giao dịch vanilla. Cấu hình sản xuất điển hình là: một mô hình cổ điển (Heston, SABR, SLV) cho định giá hàng ngày, với các phương pháp nơ-ron dùng cho những bài toán giá trị cao cụ thể nơi mô hình cổ điển liên tục thất bại.

Khi nào nên dùng neural SDE

Dùng neural SDE khi: (1) bạn có dữ liệu phong phú và họ mô hình cổ điển liên tục bỏ lỡ cùng những mẫu hình, (2) bạn định giá các công cụ exotic không có lời giải giải tích gọn gàng, hoặc (3) bạn cần một chiến lược phòng hộ tính đến các ma sát thực tế. Đừng dùng nó khi một mô hình năm tham số đã khớp đủ tốt -- bạn đang thêm độ phức tạp mà không thêm giá trị.

Bước tiếp theo:

Mô hình Heston -- chuẩn mực stochastic vol cổ điển

Stochastic Local Vol -- hiệu chỉnh cấp sản xuất kèm động lực

Rough Bergomi -- stochastic vol phân thứ, ranh giới trước các phương pháp nơ-ron