Σπίτι Ανάπτυξη Τι είναι μια διαδικασία απόφασης markov (mdp); - ορισμός από την τεχνολογία

Τι είναι μια διαδικασία απόφασης markov (mdp); - ορισμός από την τεχνολογία

Πίνακας περιεχομένων:

Anonim

Ορισμός - Τι σημαίνει η διαδικασία λήψης αποφάσεων Markov (MDP);

Μια διαδικασία λήψης αποφάσεων Markov (MDP) είναι κάτι που οι επαγγελματίες αναφέρουν ως μια «διακριτή διαδικασία στοχαστικού ελέγχου». Βασίζεται στα μαθηματικά που πρωτοστάτησε ο ρώσος ακαδημαϊκός Andrey Markov στα τέλη του 19ου και στις αρχές του 20ού αιώνα.

Η Techopedia εξηγεί τη διαδικασία λήψης αποφάσεων Markov (MDP)

Ένας τρόπος για να εξηγήσουμε τη διαδικασία λήψης αποφάσεων Markov και τις συναφείς αλυσίδες Markov είναι ότι αυτά είναι στοιχεία της σύγχρονης θεωρίας παιγνίων που βασίζονται στην απλούστερη μαθηματική έρευνα από τον ρώσο επιστήμονα πριν από εκατό χρόνια. Η περιγραφή μιας διαδικασίας απόφασης Markov είναι ότι μελετά ένα σενάριο όπου ένα σύστημα βρίσκεται σε ένα δεδομένο σύνολο κρατών και προχωρά σε ένα άλλο κράτος με βάση τις αποφάσεις ενός υπεύθυνου λήψης αποφάσεων.

Μια αλυσίδα Markov ως μοντέλο δείχνει μια ακολουθία συμβάντων όπου η πιθανότητα ενός δεδομένου συμβάντος εξαρτάται από μια κατάσταση που έχει επιτευχθεί προηγουμένως. Οι επαγγελματίες μπορούν να μιλήσουν για έναν "μετρήσιμο κρατικό χώρο" περιγράφοντας τη διαδικασία λήψης αποφάσεων Markov - μερικοί συνδέουν την ιδέα του μοντέλου απόφασης Markov με ένα μοντέλο "τυχαίου βάδισης" ή άλλο στοχαστικό μοντέλο που βασίζεται στις πιθανότητες (το τυχαίο βήμα, Street, μοντελοποιεί την κίνηση ενός μετοχικού κεφαλαίου πάνω ή κάτω σε ένα πλαίσιο πιθανότητας αγοράς).

Γενικά, οι διαδικασίες λήψης αποφάσεων Markov εφαρμόζονται συχνά σε μερικές από τις πιο εξελιγμένες τεχνολογίες στις οποίες εργάζονται σήμερα οι επαγγελματίες, για παράδειγμα, σε ρομποτικά, αυτοματοποιημένα και ερευνητικά μοντέλα.

Τι είναι μια διαδικασία απόφασης markov (mdp); - ορισμός από την τεχνολογία