Initial commit: hardened DeerFlow factory

Vendored deer-flow upstream (bytedance/deer-flow) plus prompt-injection hardening: - New deerflow.security package: content_delimiter, html_cleaner, sanitizer (8 layers — invisible chars, control chars, symbols, NFC, PUA, tag chars, horizontal whitespace collapse with newline/tab preservation, length cap) - New deerflow.community.searx package: web_search, web_fetch, image_search backed by a private SearX instance, every external string sanitized and wrapped in <<<EXTERNAL_UNTRUSTED_CONTENT>>> delimiters - All native community web providers (ddg_search, tavily, exa, firecrawl, jina_ai, infoquest, image_search) replaced with hard-fail stubs that raise NativeWebToolDisabledError at import time, so a misconfigured tool.use path fails loud rather than silently falling back to unsanitized output - Native client back-doors (jina_client.py, infoquest_client.py) stubbed too - Native-tool tests quarantined under tests/_disabled_native/ (collect_ignore_glob via local conftest.py) - Sanitizer Layer 7 fix: only collapse horizontal whitespace, preserve newlines and tabs so list/table structure survives - Hardened runtime config.yaml references only the searx-backed tools - Factory overlay (backend/) kept in sync with deer-flow tree as a reference / source See HARDENING.md for the full audit trail and verification steps.
2026-04-12 14:23:57 +02:00
commit 6de0bf9f5b
889 changed files with 173052 additions and 0 deletions
--- a/deer-flow/backend/tests/test_patched_deepseek.py
+++ b/deer-flow/backend/tests/test_patched_deepseek.py
@@ -0,0 +1,186 @@
+"""Tests for deerflow.models.patched_deepseek.PatchedChatDeepSeek.
+
+Covers:
+- LangChain serialization protocol: is_lc_serializable, lc_secrets, to_json
+- reasoning_content restoration in _get_request_payload (single and multi-turn)
+- Positional fallback when message counts differ
+- No-op when no reasoning_content present
+"""
+
+from __future__ import annotations
+
+from unittest.mock import MagicMock, patch
+
+from langchain_core.messages import AIMessage, HumanMessage
+
+
+def _make_model(**kwargs):
+    from deerflow.models.patched_deepseek import PatchedChatDeepSeek
+
+    return PatchedChatDeepSeek(
+        model="deepseek-reasoner",
+        api_key="test-key",
+        **kwargs,
+    )
+
+
+# ---------------------------------------------------------------------------
+# Serialization protocol
+# ---------------------------------------------------------------------------
+
+
+def test_is_lc_serializable_returns_true():
+    from deerflow.models.patched_deepseek import PatchedChatDeepSeek
+
+    assert PatchedChatDeepSeek.is_lc_serializable() is True
+
+
+def test_lc_secrets_contains_api_key_mapping():
+    model = _make_model()
+    secrets = model.lc_secrets
+    assert "api_key" in secrets
+    assert secrets["api_key"] == "DEEPSEEK_API_KEY"
+    assert "openai_api_key" in secrets
+
+
+def test_to_json_produces_constructor_type():
+    model = _make_model()
+    result = model.to_json()
+    assert result["type"] == "constructor"
+    assert "kwargs" in result
+
+
+def test_to_json_kwargs_contains_model():
+    model = _make_model()
+    result = model.to_json()
+    assert result["kwargs"]["model_name"] == "deepseek-reasoner"
+    assert result["kwargs"]["api_base"] == "https://api.deepseek.com/v1"
+
+
+def test_to_json_kwargs_contains_custom_api_base():
+    model = _make_model(api_base="https://ark.cn-beijing.volces.com/api/v3")
+    result = model.to_json()
+    assert result["kwargs"]["api_base"] == "https://ark.cn-beijing.volces.com/api/v3"
+
+
+def test_to_json_api_key_is_masked():
+    """api_key must not appear as plain text in the serialized output."""
+    model = _make_model()
+    result = model.to_json()
+    api_key_value = result["kwargs"].get("api_key") or result["kwargs"].get("openai_api_key")
+    assert api_key_value is None or isinstance(api_key_value, dict), f"API key must not be plain text, got: {api_key_value!r}"
+
+
+# ---------------------------------------------------------------------------
+# reasoning_content preservation in _get_request_payload
+# ---------------------------------------------------------------------------
+
+
+def _make_payload_message(role: str, content: str | None = None, tool_calls: list | None = None) -> dict:
+    msg: dict = {"role": role, "content": content}
+    if tool_calls is not None:
+        msg["tool_calls"] = tool_calls
+    return msg
+
+
+def test_reasoning_content_injected_into_assistant_message():
+    """reasoning_content from additional_kwargs is restored in the payload."""
+    model = _make_model()
+
+    human = HumanMessage(content="What is 2+2?")
+    ai = AIMessage(
+        content="4",
+        additional_kwargs={"reasoning_content": "Let me think: 2+2=4"},
+    )
+
+    base_payload = {
+        "messages": [
+            _make_payload_message("user", "What is 2+2?"),
+            _make_payload_message("assistant", "4"),
+        ]
+    }
+
+    with patch.object(type(model).__bases__[0], "_get_request_payload", return_value=base_payload):
+        with patch.object(model, "_convert_input") as mock_convert:
+            mock_convert.return_value = MagicMock(to_messages=lambda: [human, ai])
+            payload = model._get_request_payload([human, ai])
+
+    assistant_msg = next(m for m in payload["messages"] if m["role"] == "assistant")
+    assert assistant_msg["reasoning_content"] == "Let me think: 2+2=4"
+
+
+def test_no_reasoning_content_is_noop():
+    """Messages without reasoning_content are left unchanged."""
+    model = _make_model()
+
+    human = HumanMessage(content="hello")
+    ai = AIMessage(content="hi", additional_kwargs={})
+
+    base_payload = {
+        "messages": [
+            _make_payload_message("user", "hello"),
+            _make_payload_message("assistant", "hi"),
+        ]
+    }
+
+    with patch.object(type(model).__bases__[0], "_get_request_payload", return_value=base_payload):
+        with patch.object(model, "_convert_input") as mock_convert:
+            mock_convert.return_value = MagicMock(to_messages=lambda: [human, ai])
+            payload = model._get_request_payload([human, ai])
+
+    assistant_msg = next(m for m in payload["messages"] if m["role"] == "assistant")
+    assert "reasoning_content" not in assistant_msg
+
+
+def test_reasoning_content_multi_turn():
+    """All assistant turns each get their own reasoning_content."""
+    model = _make_model()
+
+    human1 = HumanMessage(content="Step 1?")
+    ai1 = AIMessage(content="A1", additional_kwargs={"reasoning_content": "Thought1"})
+    human2 = HumanMessage(content="Step 2?")
+    ai2 = AIMessage(content="A2", additional_kwargs={"reasoning_content": "Thought2"})
+
+    base_payload = {
+        "messages": [
+            _make_payload_message("user", "Step 1?"),
+            _make_payload_message("assistant", "A1"),
+            _make_payload_message("user", "Step 2?"),
+            _make_payload_message("assistant", "A2"),
+        ]
+    }
+
+    with patch.object(type(model).__bases__[0], "_get_request_payload", return_value=base_payload):
+        with patch.object(model, "_convert_input") as mock_convert:
+            mock_convert.return_value = MagicMock(to_messages=lambda: [human1, ai1, human2, ai2])
+            payload = model._get_request_payload([human1, ai1, human2, ai2])
+
+    assistant_msgs = [m for m in payload["messages"] if m["role"] == "assistant"]
+    assert assistant_msgs[0]["reasoning_content"] == "Thought1"
+    assert assistant_msgs[1]["reasoning_content"] == "Thought2"
+
+
+def test_positional_fallback_when_count_differs():
+    """Falls back to positional matching when payload/original message counts differ."""
+    model = _make_model()
+
+    human = HumanMessage(content="hi")
+    ai = AIMessage(content="hello", additional_kwargs={"reasoning_content": "My reasoning"})
+
+    # Simulate count mismatch: payload has 3 messages, original has 2
+    extra_system = _make_payload_message("system", "You are helpful.")
+    base_payload = {
+        "messages": [
+            extra_system,
+            _make_payload_message("user", "hi"),
+            _make_payload_message("assistant", "hello"),
+        ]
+    }
+
+    with patch.object(type(model).__bases__[0], "_get_request_payload", return_value=base_payload):
+        with patch.object(model, "_convert_input") as mock_convert:
+            mock_convert.return_value = MagicMock(to_messages=lambda: [human, ai])
+            payload = model._get_request_payload([human, ai])
+
+    assistant_msg = next(m for m in payload["messages"] if m["role"] == "assistant")
+    assert assistant_msg["reasoning_content"] == "My reasoning"