Fix failing tests. Add review step.

2025-12-17 12:45:26 +01:00 · 2023-06-25 14:00:06 +02:00
parent 9b86678d61
commit ba33e681df
5 changed files with 203 additions and 96 deletions
--- a/gpt_engineer/learning.py
+++ b/gpt_engineer/learning.py
@@ -0,0 +1,144 @@
+import json
+import random
+import tempfile
+
+from dataclasses import dataclass, field
+from datetime import datetime
+from pathlib import Path
+from typing import List, Optional
+
+from dataclasses_json import dataclass_json
+from termcolor import colored
+
+from gpt_engineer.db import DB, DBs
+from gpt_engineer.domain import Step
+
+
+@dataclass_json
+@dataclass
+class Review:
+    ran: Optional[bool]
+    perfect: Optional[bool]
+    works: Optional[bool]
+    comments: str
+    raw: str
+
+
+@dataclass_json
+@dataclass
+class Learning:
+    model: str
+    temperature: float
+    steps: str
+    steps_file_hash: str
+    prompt: str
+    logs: str
+    workspace: str
+    feedback: Optional[str]
+    session: str
+    review: Optional[Review]
+    timestamp: str = field(default_factory=lambda: datetime.now().isoformat())
+    version: str = "0.3"
+
+
+TERM_CHOICES = (
+    colored("y", "green")
+    + "/"
+    + colored("n", "red")
+    + "/"
+    + colored("u", "yellow")
+    + "(ncertain): "
+)
+
+
+def human_input() -> Review:
+    print()
+    print(
+        colored("To help gpt-engineer learn, please answer 3 questions:", "light_green")
+    )
+    print()
+
+    ran = input("Did the generated code run at all? " + TERM_CHOICES)
+    while ran not in ("y", "n", "u", ""):
+        ran = input("Invalid input. Please enter y, n, or u: ")
+
+    perfect = ""
+    useful = ""
+
+    if ran == "y":
+        perfect = input(
+            "Did the generated code do everything you wanted? " + TERM_CHOICES
+        )
+        while perfect not in ("y", "n", "u", ""):
+            perfect = input("Invalid input. Please enter y, n, or u: ")
+
+        if perfect != "y":
+            useful = input("Did the generated code do anything useful? " + TERM_CHOICES)
+            while useful not in ("y", "n", "u", ""):
+                useful = input("Invalid input. Please enter y, n, or u: ")
+
+    comments = ""
+    if perfect != "y":
+        comments = input(
+            "If you have time, please explain what was not working "
+            + colored("(ok to leave blank)\n", "light_green")
+        )
+    print(colored("Thank you", "light_green"))
+    return Review(
+        raw=", ".join([ran, perfect, useful]),
+        ran={"y": True, "n": False, "u": None, "": None}[ran],
+        works={"y": True, "n": False, "u": None, "": None}[useful],
+        perfect={"y": True, "n": False, "u": None, "": None}[perfect],
+        comments=comments,
+    )
+
+
+def logs_to_string(steps: List[Step], logs: DB):
+    chunks = []
+    for step in steps:
+        chunks.append(f"--- {step.__name__} ---\n")
+        messages = json.loads(logs[step.__name__])
+        chunks.append(format_messages(messages))
+    return "\n".join(chunks)
+
+
+def format_messages(messages: List[dict]) -> str:
+    return "\n".join(
+        [f"{message['role']}:\n\n{message['content']}" for message in messages]
+    )
+
+
+def extract_learning(
+    model: str, temperature: float, steps: List[Step], dbs: DBs, steps_file_hash
+) -> Learning:
+    review = None
+    if "review" in dbs.memory:
+        review = Review.from_json(dbs.memory["review"])  # type: ignore
+    learning = Learning(
+        prompt=dbs.input["prompt"],
+        model=model,
+        temperature=temperature,
+        steps=json.dumps([step.__name__ for step in steps]),
+        steps_file_hash=steps_file_hash,
+        feedback=dbs.input.get("feedback"),
+        session=get_session(),
+        logs=logs_to_string(steps, dbs.logs),
+        workspace=dbs.workspace["all_output.txt"],
+        review=review,
+    )
+    return learning
+
+
+def get_session():
+    path = Path(tempfile.gettempdir()) / "gpt_engineer_user_id.txt"
+
+    try:
+        if path.exists():
+            user_id = path.read_text()
+        else:
+            # random uuid:
+            user_id = str(random.randint(0, 2**32))
+            path.write_text(user_id)
+        return user_id
+    except IOError:
+        return "ephemeral_" + str(random.randint(0, 2**32))