Próbuję zrobić Tic-Tac-toe w JavaScript przy użyciu algorytmu Minimax, ale wydaje się, że robię coś złego i algorytm Minimax, nie wykrywa najlepszego ruchu. Oto kod:

const board = ["X", null, null, null, null, "X", "X", "O", "O"];
/*
    X   _   _
    _   _   X
    X   O   O

*/

// duplicate passed board and return the new board state
const makeAIMove = (currentBoard, square, player) => {
    const nextBoard = [...currentBoard];
    nextBoard[square] = player;
    return nextBoard;
};

// find empty squares
const emptySquares = (sqBoard) =>
    sqBoard
        .map((sq, idx) => (sq === null ? idx : null))
        .filter((sq) => sq !== null);

// check if no empty squares are available
const isFinished = (sqBoard) => (emptySquares(sqBoard).length ? false : true);

// check winner
const checkWinner = (sqBoard) => {
    const winConditions = [
        [0, 1, 2],
        [3, 4, 5],
        [6, 7, 8],
        [0, 3, 6],
        [1, 4, 7],
        [2, 5, 8],
        [0, 4, 8],
        [2, 4, 6],
    ];

    for (const winCondition of winConditions) {
        [a, b, c] = winCondition;
        if (sqBoard[a] && sqBoard[a] === sqBoard[b] && sqBoard[a] === sqBoard[c])
            return sqBoard[a];
    }

    return false;
};

// minimax algorithm
const minimax = (sqBoard, depth, isMaximizer) => {
    // terminal checker
    const theWinner = checkWinner(sqBoard);
    // we have a winner
    if (theWinner) {
        return theWinner === "X" ? -10 : 10;
    }
    // it's a tie
    if (isFinished(sqBoard)) {
        return 0;
    }

    let bestScore;
    if (isMaximizer) {
        bestScore = -1000;
        emptySquares(sqBoard).forEach((square) => {
            // make a sample move
            let nextBoard = makeAIMove(sqBoard, square, "O");

            // recursion
            let score = minimax(nextBoard, depth + 1, false);
            bestScore = Math.max(bestScore, score);
        });
    } else {
        bestScore = 1000;
        emptySquares(sqBoard).forEach((square) => {
            let nextBoard = makeAIMove(sqBoard, square, "X");
            let score = minimax(nextBoard, depth + 1, true);
            bestScore = Math.min(bestScore, score);
        });
    }
    return bestScore;
};

// find the best move
const nextBestMove = (sqBoard) => {
    let nextMoveArray = [];
    let remainedSquares = emptySquares(sqBoard);
    remainedSquares.forEach((square) => {
        let nextBoard = makeAIMove(sqBoard, square, "O");
        let theScore = minimax(nextBoard, 0, true);
        nextMoveArray.push({
            sq: square,
            sc: theScore,
        });
    });

    nextMoveSorted = nextMoveArray.sort((a, b) => (a.sc < b.sc ? 1 : -1));
    return nextMoveSorted[0].sq;
};

console.log(nextBestMove(board));

W powyższym stanie najlepszym ruchem będzie zatrzymanie x wygrać, wypełniając deskę [3] za pomocą "O", ale zawsze wykrywa inny ruch, który ma wyższy wynik.

Czy ktoś może pomóc mi zrozumieć, co się dzieje z moim kodem?

Dziękuję Ci.

0
ImanGM 10 październik 2020, 19:53

1 odpowiedź

Najlepsza odpowiedź

Z twojego kodu rozumiem, że X jest minimalizującym i o maksymalizującym graczem. Ale potem widzę ten kod:

    let nextBoard = makeAIMove(sqBoard, square, "O");
    let theScore = minimax(nextBoard, 0, true);

Więc po przeniesieniu O minimax z isMaximizer ustawiony na true. Ale to zrobi minimax odtwarzaj inny ruch, podczas gdy o odegrał już. Chcesz uzyskać najlepszą odpowiedzi na X, więc powinieneś tutaj przejść false:

    let theScore = minimax(nextBoard, 0, false);

Teraz powróci -10 za każde takie połączenie (tak dla każdego ruchu o), ponieważ gra jest już w utraconym stanie dla O, cokolwiek robi, X wygra. Jeśli o przeniesie się o 3, to X odtwarza 2 z podwójnym atakiem.

Jeśli chcesz odróżnić szybkie zwycięstwa i zwrócone wygrywa, powinieneś dostosować wynik na każdym zakwaterowaniu.

Na przykład można zastąpić oświadczenie return bestScore z powrotem wartości, która jest jedną jednostką bliżej zero. Tak więc na przykład -10 staje się -9 i 5 staje się 4, a 0 pozostaje 0:

    return bestScore - Math.sign(bestScore);

Dzięki tej zmianie, o zagagati o 3, ponieważ jego wynik jest -7 (wciąż przegrywa), podczas gdy inne przenosi wszystkie wyniki -9 (przegrywane natychmiast jednym ruchem z X).

1
trincot 10 październik 2020, 19:05