Randomness · 2·~30 min read·🟢 Light exam — recap που πρέπει να ξυπνήσει

Random variables — γρήγορος οδηγός

Χρειάζεσαι:Γιατί χρειαζόμαστε πιθανότητα

1. Νιώσε

Το έχεις ξανασυναντήσει σε άλλο μάθημα (Πιθανότητες & Στατιστική). Δεν θα το ξαναδιδάξουμε από την αρχή. Όμως αν το έχεις ξεχάσει ή δεν το είδες ποτέ καλά, αυτή η σελίδα είναι ο γρήγορος οδηγός: ένα recap εστιασμένο μόνο σε όσα χρειάζεται το K21.

Γιατί είναι κρίσιμο τώρα; Γιατί στο επόμενο κεφάλαιο κάθε στατιστική που θα γράψουμε για μια τυχαία διαδικασία είναι στο βάθος της απλώς μια στατιστική τυχαίας μεταβλητής σε σταθερό («παγωμένο») χρόνο:

Η μεγάλη ιδέα — γιατί αξίζει αυτή η σελίδα

Στο επόμενο κεφάλαιο θα «παγώνουμε» ένα τυχαίο σήμα $X (t)$ σε μία στιγμή $t$ και θα κοιτάμε την τιμή του εκείνη τη στιγμή — που είναι μια τυχαία μεταβλητή. Κάθε ποσότητα που θα υπολογίσουμε για το σήμα γεννιέται από εκεί:

ο μέσος του σήματος σε μια στιγμή είναι ο μέσος μιας ΤΜ·
η αυτοσυσχέτιση (μια ποσότητα που θα μετράει πόσο «μοιάζει» το σήμα ανάμεσα σε δύο στιγμές) είναι ο μέσος ενός γινομένου δύο ΤΜ — γι' αυτό θα χρειαστούμε τη joint κατανομή τους (§6)·
το φάσμα ισχύος προκύπτει με Fourier πάνω σε αυτή την αυτοσυσχέτιση.

Δεν χρειάζεται να μπορείς να διαβάσεις ή να γράψεις τους τύπους τους τώρα — θα τις συναντήσεις γραμμένες ως $m_{X} (t)$ , $R_{X} (t_{1}, t_{2})$ , $S_{X} (f)$ , και χτίζονται μία-μία από το μηδέν στα Random processes και PSD. Εδώ κράτα μόνο το σχήμα: όλα ανάγονται σε «μέσο μιας ΤΜ» ή «μέσο γινομένου δύο ΤΜ». Και ακριβώς αυτά τα δύο τα στήνει η σελίδα που διαβάζεις τώρα (μέσος → §4, γινόμενο δύο ΤΜ → §6).

Άρα αυτή δεν είναι «φιλική παρένθεση», αλλά ο σκελετός κάθε επόμενου υπολογισμού σε ολόκληρη την ομάδα Randomness και στην ανάλυση θορύβου που ακολουθεί (πλήρης χάρτης στην §13).

Αν λοιπόν αυτή η σελίδα σου φαίνεται «εύκολη», αυτό είναι καλό σημάδι — σημαίνει ότι θα διαβάζεις τις επόμενες σελίδες χωρίς να σκοντάφτεις σε ΤΜ-διαδικαστικά.

2. Τι είναι μια τυχαία μεταβλητή

Μια τυχαία μεταβλητή (ΤΜ) $X$ — στα αγγλικά random variable, με συντομογραφία RV — είναι ένας αριθμός που παίρνει την τιμή του από ένα τυχαίο πείραμα. Θα τη γράφουμε ΤΜ σε όλη τη σελίδα. Παραδείγματα:

Ρίξε νόμισμα: $X = 0$ αν κορώνα, $X = 1$ αν γράμματα.
Μέτρα τη θερμοκρασία ενός αντιστάτη: $X$ = η ένδειξη του βολτομέτρου σε ένα τυχαίο πείραμα.
Δες το επόμενο sample θορύβου από έναν δέκτη: $X$ = η τιμή του στο επόμενο millisecond.

Σύμβαση συμβολισμού — υπάρχουν τρεις βασικοί συμβολισμοί που θα δεις παντού στο κεφάλαιο:

Σύμβολο	Σημασία
$X$ (κεφαλαίο)	Η ΤΜ ως αντικείμενο — η αφηρημένη έννοια.
$x$ (πεζό)	Μια συγκεκριμένη τιμή που μπορεί να πάρει η $X$ .
$a$ (πεζό λατινικό, κάποιες φορές)	Ίδιο πράγμα με το $x$ — οι διαφάνειες του K21 προτιμούν την παράμετρο $a$ μέσα στο $f_{X (t)} (a)$ όταν δουλεύουν με ΤΔ (βλ. slide 10). Είναι απλώς θέμα γραμμάτου — όχι διαφορά νοήματος.

Όταν δηλαδή γράφουμε $P (X \leq x)$ ή $f_{X} (x)$ , το $x$ είναι το «όρισμα» — δείχνει «σε ποια τιμή αξιολογώ τη συνάρτηση». Το $X$ από την άλλη είναι η ΤΜ καθαυτή. (Το σύμβολο $P (\cdot)$ διαβάζεται «η πιθανότητα του…» — το χρησιμοποιούμε αμέσως παρακάτω στην §3.)

3. CDF και PDF — η ταυτότητα μιας ΤΜ

Μια ΤΜ χαρακτηρίζεται πλήρως από την κατανομή πιθανότητας της — δηλαδή από το «ποιες τιμές παίρνει, και με τι πιθανότητα την καθεμία» (η έννοια που χτίσαμε διαισθητικά στο /randomness/why). Δύο ισοδύναμοι τρόποι να την περιγράψεις:

3α. CDF (cumulative distribution function)

Η CDF δίνει την πιθανότητα η ΤΜ να μην ξεπερνά κάποιο όριο $x$ — δηλαδή «πόση πιθανότητα έχει μαζευτεί μέχρι το $x$ ». Συγκεκριμένα, αυτή η μαζεμένη πιθανότητα είναι το εμβαδόν κάτω από την καμπύλη πυκνότητας $f_{X}$ από το $- \infty$ μέχρι το $x$ :

F_{X} (x) = P (X \leq x) = \int_{- \infty}^{x} f_{X} (u) d u .

(Η $f_{X} \geq 0$ είναι η πυκνότητα πιθανότητας — πόσο «πυκνά» στοιβάζεται πιθανότητα γύρω από κάθε τιμή· την ορίζουμε ακριβώς στην §3β αμέσως παρακάτω. Το $u$ είναι απλώς η μεταβλητή ολοκλήρωσης που «τρέχει» από το $- \infty$ μέχρι το όριο $x$ — γράφουμε $u$ και όχι $x$ για να μην μπερδεύεται με το σταθερό πάνω όριο.)

Με αυτή τη μορφή, το γιατί η $F_{X}$ είναι πάντα μη-φθίνουσα γίνεται προφανές: καθώς μεγαλώνει το $x$ , το πάνω όριο του ολοκληρώματος μετακινείται δεξιά, οπότε σαρώνεις περισσότερο εμβαδόν κάτω από μια καμπύλη που δεν γίνεται ποτέ αρνητική ( $f_{X} \geq 0$ ). Άρα το μαζεμένο εμβαδόν μόνο να μένει ίδιο ή να μεγαλώνει μπορεί — ποτέ να μικραίνει. (Με λόγια: για μεγαλύτερο $x$ προσθέτεις τις πιθανότητες ακόμη περισσότερων τιμών, και οι πιθανότητες δεν είναι ποτέ αρνητικές.) Τα δύο άκρα βγαίνουν από το ίδιο ολοκλήρωμα: $F_{X} (- \infty) = 0$ (μηδενικό εμβαδόν — δεν έχει μαζευτεί τίποτα ακόμη) και $F_{X} (+ \infty) = 1$ (όλο το εμβαδόν κάτω από την $f_{X}$ , που είναι πάντα 1 — η συνολική μάζα πιθανότητας).

3β. PDF (probability density function)

Μόλις γράψαμε την CDF ως ολοκλήρωμα της πυκνότητας $f_{X}$ . Πηγαίνοντας αντίστροφα, η $f_{X}$ είναι η παράγωγος της CDF:

f_{X} (x) = \frac{d F _{X} ( x )}{d x} .

Αυτό δεν είναι νέος, ανεξάρτητος ορισμός — είναι ακριβώς το αντίστροφο του ολοκληρώματος της §3α. Η παράγωγος ενός ολοκληρώματος ως προς το πάνω όριό του σου δίνει πίσω την ίδια τη συνάρτηση που ολοκλήρωσες (αυτό είναι το θεμελιώδες θεώρημα του λογισμού). Άρα CDF και PDF είναι οι δύο όψεις του ίδιου νομίσματος: ολοκληρώνεις την πυκνότητα για να μαζέψεις πιθανότητα (CDF), παραγωγίζεις τη CDF για να πάρεις πίσω την πυκνότητα. Διαισθητικά: η πυκνότητα είναι ο ρυθμός με τον οποίο μαζεύεται η πιθανότητα καθώς προχωράς στο $x$ .

Ιδιότητες: $f_{X} (x) \geq 0$ και $\int_{- \infty}^{\infty} f_{X} (x) d x = 1$ (το ολικό εμβαδόν κάτω από την PDF είναι πάντα 1 — η συνολική «μάζα πιθανότητας»).

Διαβάζοντας την PDF — η πιθανότητα η ΤΜ να βρίσκεται σε ένα μικρό διάστημα γύρω από $x$ είναι περίπου $f_{X} (x) d x$ . Όχι «η πιθανότητα να είναι ακριβώς $x$ » — αυτή είναι 0 για συνεχείς ΤΜ. Σκέψου την PDF ως «πυκνότητα πιθανότητας» (γι' αυτό το όνομα). Για να πάρεις πραγματική πιθανότητα, ολοκληρώνεις:

P (a \leq X \leq b) = \int_{a}^{b} f_{X} (x) d x .

3γ. Η ίδια ιδέα για διακριτές ΤΜ — PMF

Για διακριτές ΤΜ (που παίρνουν πεπερασμένες ή αριθμήσιμες τιμές — δηλαδή μια ξεχωριστή λίστα τιμών, π.χ. $0, 1, 2, \dots$ , όχι ένα συνεχές διάστημα), χρησιμοποιούμε τη συνάρτηση μάζας πιθανότητας (probability mass function, PMF) αντί για PDF:

P (X = x_{i}) = p_{i}, i \sum p_{i} = 1.

Εδώ το $P (X = x_{i})$ είναι πραγματική πιθανότητα, όχι πυκνότητα.

PDF/CDF/PMF σε μία ανάσα

Λέξεις-κλειδιά

CDF = P(X ≤ x), πάντα 0 → 1
PDF = παράγωγος CDF, εμβαδόν = 1
P(a ≤ X ≤ b) = ∫_a^b f_X dx
PMF για διακριτές, μάζα όχι πυκνότητα
PDF · dx ≈ πιθανότητα γύρω από x

Βήματα

Αν σου δίνουν CDF και χρειάζεσαι PDF: παράγωγο.
Αν σου δίνουν PDF και χρειάζεσαι πιθανότητα σε διάστημα: ολοκλήρωμα.
Αν σου δίνουν PDF και χρειάζεσαι μέσο/διασπορά: τύπος LOTUS (§7).
Στις διακριτές δουλεύεις με αθροίσματα αντί για ολοκληρώματα — η «πυκνότητα» γίνεται «μάζα».

Η συχνότερη παγίδα

Το f_X(x) δεν είναι πιθανότητα. Είναι πυκνότητα — μπορεί να ξεπερνά το 1 (π.χ. Gaussian με σ < 0.4). Πιθανότητα παίρνεις μόνο μετά από ολοκλήρωμα.

4. Mean, variance, και ισχύς

4α. Expectation (μέσος, mean)

Το αριθμητικό «κέντρο» της κατανομής:

μ_{X} = E [X] = \int_{- \infty}^{\infty} x f_{X} (x) d x

(ή $\sum_{i} x_{i} p_{i}$ για διακριτές).

Τι σου λέει ο μέσος; Είναι η «τυπική», κεντρική τιμή της ΤΜ — το σημείο ισορροπίας της κατανομής. Αν επαναλάμβανες το τυχαίο πείραμα πολλές φορές και σημείωνες κάθε φορά την τιμή της $X$ , ο μακροπρόθεσμος μέσος όρος όλων αυτών των τιμών θα έτεινε στο $E [X]$ . Στον τύπο, κάθε δυνατή τιμή $x$ «ζυγίζεται» με την πυκνότητα/πιθανότητά της $f_{X} (x)$ — γι' αυτό ο μέσος είναι ένας σταθμισμένος μέσος.

Τι ΔΕΝ σου λέει; Τίποτα για το πόσο απλώνονται οι τιμές γύρω από αυτό το κέντρο. Δύο ΤΜ μπορεί να έχουν ακριβώς τον ίδιο μέσο αλλά εντελώς διαφορετική συμπεριφορά: η μία να κάθεται κολλητά γύρω από τον μέσο, η άλλη να πετάγεται συχνά μακριά του. Αυτό το «πόσο μακριά απλώνεται» δεν φαίνεται καθόλου στον $E [X]$ — το μετράει η διασπορά (variance), που είναι ακριβώς το επόμενο βήμα (§4β).

4β. Variance (διασπορά)

Η μέση τετραγωνική απόκλιση από τον μέσο:

σ_{X}^{2} = Var (X) = E [(X - μ_{X})^{2}] = E [X^{2}] - μ_{X}^{2} .

Standard deviation: $σ_{X} = σ_{X}^{2}$ .

Mean square value (η πιο «ηλεκτρική» στατιστική):

E [X^{2}] = \int_{- \infty}^{\infty} x^{2} f_{X} (x) d x = μ_{X}^{2} + σ_{X}^{2} .

Γιατί νοιάζεσαι; Αν $X$ είναι μια στιγμιαία τιμή σήματος, τότε το $E [X^{2}]$ είναι η μέση ισχύς του σήματος. Για zero-mean σήματα ( $μ_{X} = 0$ ), ισχύς $=$ διασπορά $= σ_{X}^{2}$ . Αυτή είναι η σύνδεση που θα ξανασυναντήσεις σε κάθε υπολογισμό SNR αργότερα.

4γ. Linearity — και τα όριά της

Για οποιεσδήποτε σταθερές $a, b$ και ΤΜ $X, Y$ :

E [a X + bY] = a E [X] + b E [Y] .

Ισχύει πάντα, ανεξάρτητα από το αν τα $X, Y$ είναι ανεξάρτητα μεταξύ τους. Είναι η πιο χρήσιμη ιδιότητα στο κεφάλαιο — την εφαρμόζεις χωρίς δεύτερη σκέψη.

Για διασπορά όμως:

Var (a X + bY) = a^{2} Var (X) + b^{2} Var (Y) + 2 ab Cov (X, Y) .

Εδώ εμφανίζεται μια καινούρια ποσότητα, το $Cov (X, Y)$ (συνδιακύμανση / covariance): ένα μέτρο του πόσο «κινούνται μαζί» οι δύο ΤΜ. Δεν χρειάζεται να ξέρεις ακόμη τον τύπο της — τον χτίζουμε από το μηδέν στην §6γ· για τώρα αρκεί η διαίσθηση ότι μετράει μόνο τη γραμμική συμμεταβολή (το κατά πόσο τα ζεύγη $(X, Y)$ ακολουθούν μια ευθεία τάση, $Y \approx a X + b$ ) και είναι 0 όταν δεν υπάρχει τέτοια γραμμική σχέση (τότε οι ΤΜ λέγονται ασυσχέτιστες). Τι ακριβώς σημαίνει «γραμμική σχέση» και πώς την ελέγχεις, στην §6γ.

«Ασυσχέτιστες» δεν είναι το ίδιο με «ανεξάρτητες»

Εύκολο να μπερδευτείς εδώ. Το να είναι ανεξάρτητες — το αποτέλεσμα της μίας να μην αλλάζει καθόλου τις πιθανότητες της άλλης — είναι πιο δυνατή συνθήκη από το $Cov = 0$ :

ανεξάρτητες $\Rightarrow$ $Cov = 0$ πάντα·
αλλά $Cov = 0 \neq \Rightarrow$ ανεξάρτητες: δύο ΤΜ μπορεί να είναι ακόμη και απόλυτα εξαρτημένες και όμως να έχουν $Cov = 0$ , αν η σχέση τους είναι «καμπύλη». Το covariance βλέπει μόνο ευθείες — αν η μία καθορίζει την άλλη με παραβολή (π.χ. $Y = X^{2}$ ), δεν το «πιάνει».

Άρα: «δεν σχετίζονται γραμμικά» (ασυσχέτιστες) $\neq =$ «δεν σχετίζονται καθόλου» (ανεξάρτητες). Τη διάκριση τη χτίζουμε αναλυτικά στην §6δ, με ακριβώς το παράδειγμα $Y = X^{2}$ .

Ο σταυρωτός όρος $2 ab Cov (X, Y)$ εξαφανίζεται μόνο όταν $Cov (X, Y) = 0$ — αρκεί δηλαδή οι ΤΜ να είναι ασυσχέτιστες (η ανεξαρτησία είναι αρκετή, αλλά παραπάνω απ' όσο χρειάζεται). Αυτή η ασυμμετρία «linearity πάντα, variance υπό όρους» είναι κλασική πηγή λαθών.

5. Κύριες κατανομές που θα συναντήσεις

Πρώτα, η σημειογραφία $X \sim \dots$ Το σύμβολο $\sim$ διαβάζεται «ακολουθεί την κατανομή» (ή «κατανέμεται ως»). Έτσι το $X \sim U (a, b)$ σημαίνει «η $X$ έχει uniform κατανομή με παραμέτρους $a, b$ » — μας λέει δηλαδή συνοπτικά ποια είναι η PDF της $X$ . Το γράμμα πριν την παρένθεση είναι το όνομα της οικογένειας ( $U$ = Uniform, $N$ = Normal/Gaussian, …) και οι αριθμοί μέσα οι παράμετροί της. Π.χ. « $X \sim U (0, 1)$ » είναι σκέτη συντομογραφία του « $f_{X} (x) = 1$ στο $[0, 1]$ , $0$ αλλιώς». (Για συνεχείς ΤΜ, $U [a, b]$ και $U (a, b)$ είναι ουσιαστικά το ίδιο: τα άκρα δεν αλλάζουν πιθανότητες, αφού ένα μεμονωμένο σημείο έχει πιθανότητα $0$ .)

Αντί να τις διαβάσεις απλώς ως πίνακα, σύρε τους ολισθητές στο παρακάτω και νιώσε πώς η κάθε παράμετρος αλλάζει το σχήμα:

Κύριες κατανομές — PDF, μέσος, διασπορά

μ (mean) = 0.0

σ (std dev) = 1.00

E[X]

0.000

Var(X)

1.000

68% της μάζας μέσα σε ±σ από τον μέσο, 95% σε ±2σ, 99.7% σε ±3σ. Πανταχού παρούσα: ο θερμικός θόρυβος είναι Gaussian (Central Limit Theorem — άθροισμα πολλών μικρών ανεξάρτητων διεγέρσεων).

Διαίσθηση

Παρατήρηση από το viz (κοίτα το ύψος της κορυφής σε σχέση με τις οριζόντιες γραμμές ύψους — ο κάθετος άξονας είναι πλέον σταθερός): όταν διπλασιάζεις το $σ$ μιας Gaussian, το peak της PDF πέφτει στο μισό (γιατί το συνολικό εμβαδόν παραμένει 1). Όταν πλαταίνεις το διάστημα $[a, b]$ μιας Uniform, το ύψος της πέφτει για τον ίδιο λόγο. Η κατανομή «εξαπλώνεται» αλλά παραμένει η ίδια ταυτότητα. Και αντίστροφα: για μικρό $σ$ (ή στενό $[a, b]$ ) η κορυφή ξεπερνά το 1 — δες την να περνάει πάνω από τη γραμμή $y = 1$ . Δεν είναι λάθος: η PDF είναι πυκνότητα, όχι πιθανότητα.

5α. Uniform U(a, b)

PDF: $f_{X} (x) = 1/ (b - a)$ για $x \in [a, b]$ , αλλιώς 0.

$E [X] = (a + b) /2$
$Var (X) = (b - a)^{2} /12$

Συχνή χρήση στο K21: η τυχαία φάση $Θ \sim U (0, 2 π)$ (ή $U (- π, π)$ , ή $U (0, π)$ ) σε διαμορφώσεις — όταν δεν έχουμε καμία προτίμηση για συγκεκριμένη φάση, η ομοιόμορφη κατανομή είναι το «αμερόληπτο» μοντέλο. Θα τη συναντήσεις παντού στο επόμενο κεφάλαιο.

5β. Gaussian / Normal $N (μ, σ^{2})$

f_{X} (x) = \frac{1}{σ 2 π} e^{- (x - μ)^{2} / (2 σ^{2})} .

$E [X] = μ$
$Var (X) = σ^{2}$
68 % της μάζας μέσα σε $\pm σ$ , 95 % σε $\pm 2 σ$ , 99.7 % σε $\pm 3 σ$ — αυτό είναι το «εμπειρικό κανόνα» που θα σου χρειαστεί για να εκτιμήσεις πιθανότητες σφαλμάτων στις noise σελίδες.

Πανταχού παρούσα στα συστήματα επικοινωνιών:

Ο θερμικός θόρυβος ακολουθεί Gaussian κατανομή πλάτους — γι' αυτό λέμε AWGN (Additive White Gaussian Noise). Η αιτία είναι το Central Limit Theorem (CLT): ο θόρυβος είναι το άθροισμα πολλών μικρών ανεξάρτητων ηλεκτρικών διεγέρσεων, άρα τείνει να γίνει Gaussian.
Πολλά τυχαία σήματα (interference, fading) προσεγγίζονται καλά ως Gaussian.

5γ. Exponential $(λ)$

f_{X} (x) = λ e^{- λ x} για x \geq 0

$E [X] = 1/ λ$
$Var (X) = 1/ λ^{2}$

Χρήση: χρόνοι μεταξύ τυχαίων γεγονότων (π.χ. arrivals πακέτων σε ένα δίκτυο). Το K21 δεν εξετάζει συστηματικά εκθετικές, αλλά είναι καλό να την αναγνωρίζεις — αν δεις «memoryless» ή «inter-arrival time», αυτή είναι.

5δ. Bernoulli, Binomial, Poisson

Διακριτές κατανομές — δεν αποτελούν κεντρικό υλικό στο K21:

Bernoulli(p): $P (X = 1) = p$ , $P (X = 0) = 1 - p$ . Νόμισμα.
Binomial(n, p): άθροισμα n ανεξάρτητων Bernoulli. «Πόσες κορώνες σε n ρίψεις;»
Poisson(λ): αριθμός γεγονότων σε σταθερό διάστημα όταν ο ρυθμός είναι λ.

6. Joint distributions, independence, covariance

Πολλά πράγματα στο κεφάλαιο εμπλέκουν δύο ΤΜ (π.χ. $X (t_{1})$ και $X (t_{2})$ — η ίδια ΤΔ σε δύο διαφορετικές στιγμές). Χρειαζόμαστε λοιπόν εργαλεία για ζεύγη.

6α. Joint PDF

Για δύο ΤΜ $X, Y$ , η joint PDF $f_{X, Y} (x, y)$ είναι η πυκνότητα του ζεύγους — το 2D ανάλογο της PDF μιας μεταβλητής: μια επιφάνεια πάνω από το επίπεδο των $(x, y)$ , ψηλή εκεί όπου το ζεύγος εμφανίζεται συχνά. Η πιθανότητα ότι το $(X, Y)$ πέφτει σε μια μικρή περιοχή γύρω από $(x, y)$ είναι περίπου $f_{X, Y} (x, y) d x d y$ .

Ορίζεται για οποιοδήποτε ζεύγος ΤΜ — ανεξάρτητα ή όχι — και είναι η πλήρης περιγραφή του πώς συν-κατανέμονται τα δύο. Δύο πράγματα να προσέξεις εδώ, γιατί μπερδεύουν. Πρώτον, εν γένει δεν χτίζεται από τις δύο ξεχωριστές $f_{X}, f_{Y}$ — σε λίγο θα δεις γιατί. Δεύτερον, και πιο σημαντικό για τα συστήματα επικοινωνιών: δεν σου δίνεται έτοιμη σαν τύπος $f_{X, Y} (x, y) = \dots$ . Αυτό που έχεις στα χέρια σου είναι μια σχέση — π.χ. $Y = X + N$ (λαμβανόμενο = σήμα + θόρυβος), ή τα $X (t_{1}), X (t_{2})$ της ίδιας ΤΔ σε δύο στιγμές, ή η είσοδος/έξοδος ενός φίλτρου — μαζί με τις κατανομές των κομματιών. Από αυτά την κατασκευάζεις· το εργαλείο της κατασκευής (ο κανόνας γινομένου) έρχεται αμέσως παρακάτω, και μετά τη φτιάχνουμε ολόκληρη σε ένα ρεαλιστικό παράδειγμα.

Marginals — από την joint μπορείς πάντα να γυρίσεις στην κατανομή μιας μόνο μεταβλητής, «ολοκληρώνοντας έξω» την άλλη:

f_{X} (x) = \int_{- \infty}^{\infty} f_{X, Y} (x, y) d y .

Πρόσεξε την ασυμμετρία: joint $\to$ marginal γίνεται πάντα (ολοκληρώνεις έξω τη μία)· το αντίστροφο όχι — από τα δύο marginals και μόνο δεν ξαναφτιάχνεις την joint, γιατί σου λείπει το «δέσιμό» τους.

Αυτό το δέσιμο το δίνει η δεσμευμένη (conditional) πυκνότητα. Πράγματι, πάντα — ανεξάρτητα ή όχι — η joint γράφεται ως (δεσμευμένη) × (περιθώρια):

f_{X, Y} (x, y) = f_{X ∣ Y} (x ∣ y) f_{Y} (y) = f_{Y ∣ X} (y ∣ x) f_{X} (x),

όπου $f_{X ∣ Y} (x ∣ y)$ διαβάζεται «η πυκνότητα της $X$ δεδομένου ότι η $Y$ πήρε την τιμή $y$ ». Το επιπλέον λοιπόν που χρειάζεσαι πέρα από τα δύο marginals είναι ακριβώς αυτή η δεσμευμένη — αυτή κουβαλάει όλη την πληροφορία για το πώς «δένεται» η μία ΤΜ με την άλλη.

Εδώ δεν μας δίνουν την $f_{X, Y}$ · μας δίνουν μια σχέση και τα κομμάτια της. Έστω σήμα $X \sim U [0, 1]$ και ανεξάρτητος θόρυβος $N \sim U [0, 1]$ , και λαμβάνουμε

Y = X + N .

(Διαλέγω uniform κομμάτια μόνο για να βγαίνει καθαρά το ολοκλήρωμα· με Gaussian θόρυβο — η περίπτωση AWGN — η μηχανική είναι ολόιδια.) Οι $X, Y$ είναι ολοφάνερα εξαρτημένες: το $Y$ κουβαλάει μέσα του το $X$ .

Βήμα 1 — φτιάχνω την joint με τον κανόνα γινομένου. Δεν την έχω έτοιμη, τη συναρμολογώ. Από τις δύο μορφές $f_{X, Y} = f_{X ∣ Y} f_{Y} = f_{Y ∣ X} f_{X}$ διαλέγω εκείνη που διαβάζεται κατευθείαν από τη σχέση — την $f_{Y ∣ X} f_{X}$ :

f_{X, Y} (x, y) = f_{Y ∣ X} (y ∣ x) f_{X} (x) .

Το $f_{X} (x) = 1$ στο $[0, 1]$ . Σημείωση — το $1$ εδώ είναι πυκνότητα, όχι πιθανότητα: πιθανότητα παίρνεις μόνο ως εμβαδόν, και σε όλο το $[0, 1]$ βγαίνει $\int_{0}^{1} 1 d x = 1$ (= 100%, το $X$ είναι σίγουρα κάπου εκεί)· ένα μεμονωμένο σημείο έχει $P (X = x) = 0$ . Για το conditional: δεδομένου ότι $X = x$ , είναι $Y = x + N \Leftrightarrow N = Y - x$ — το $Y$ είναι απλώς ο θόρυβος μετατοπισμένος κατά τη σταθερά $x$ . Γιατί τότε $f_{Y ∣ X} (y ∣ x) = f_{N} (y - x)$ ; Επειδή για να βγει το $Y$ ακριβώς στην τιμή $y$ , ο θόρυβος πρέπει να πάρει ακριβώς την τιμή $N = y - x$ — μόνο τότε $x + N = y$ . Άρα η πυκνότητα του $Y$ στο $y$ είναι όση ακριβώς και η πυκνότητα του $N$ στο $y - x$ (κι αφού ο $N$ είναι ανεξάρτητος του $X$ , το να ξέρουμε το $x$ δεν αλλάζει καθόλου την κατανομή του $N$ ). Τυπικά: $P (Y \leq y ∣ X = x) = P (N \leq y - x) = F_{N} (y - x)$ , και παραγωγίζοντας ως προς $y$ προκύπτει:

f_{Y ∣ X} (y ∣ x) = f_{N} (y - x) = 1 για 0 \leq y - x \leq 1, δηλαδ \overset{η}{ˊ} x \leq y \leq x + 1.

Το « $= 1$ » είναι ακριβώς η uniform πυκνότητα: η $U [0, 1]$ έχει $f_{N} = 1$ σταθερά μέσα στο $[0, 1]$ (και $0$ έξω) — πάλι ύψος $1$ ώστε το εμβαδόν να βγει $1$ . Άρα η joint είναι

f_{X, Y} (x, y) = f_{X} (x) f_{N} (y - x) = 1 στη λωρ \overset{ι}{ˊ} δα {0 \leq x \leq 1, x \leq y \leq x + 1}, αλλι \overset{ω}{ˊ} ς 0.

Νά την — την υπολογίσαμε από τη σχέση, δεν μας δόθηκε.

Βήμα 2 — marginal $f_{Y} (y)$ , «ολοκληρώνοντας έξω» το $x$ . Ο ίδιος τύπος marginalization, με τους ρόλους $x \leftrightarrow y$ αλλαγμένους:

f_{Y} (y) = \int_{- \infty}^{\infty} f_{X, Y} (x, y) d x = \int_{- \infty}^{\infty} f_{N} (y - x) f_{X} (x) d x .

Στάσου μια στιγμή εδώ: αυτό είναι συνέλιξη, $f_{Y} = f_{X} * f_{N}$ . Δεν είναι σύμπτωση — η πυκνότητα ενός αθροίσματος ανεξάρτητων ΤΜ είναι πάντα η συνέλιξη των δύο πυκνοτήτων (η ίδια συνέλιξη που κυριαρχεί σε όλο το μάθημα).

Το ολοκλήρωμα βγαίνει «μετρώντας επικάλυψη». Ο integrand $f_{N} (y - x) f_{X} (x)$ είναι $1$ μόνο εκεί που ισχύουν ταυτόχρονα και τα δύο support (αλλιώς $0$ ): το $x$ μέσα στο $[0, 1]$ (από το $f_{X}$ ) και το $x$ μέσα στο $[y - 1, y]$ (από το $0 \leq y - x \leq 1$ ). Επειδή εκεί ο integrand είναι σταθερά $1$ , το ολοκλήρωμα είναι ακριβώς το μήκος αυτής της επικάλυψης.

Το παράθυρο $[y - 1, y]$ έχει σταθερό πλάτος $1$ και, καθώς το $y$ ανεβαίνει από $0$ ως $2$ , ολισθαίνει προς τα δεξιά πάνω από το σταθερό $[0, 1]$ . Τρεις περιπτώσεις:

$0 \leq y \leq 1$ — το παράθυρο μπαίνει από αριστερά: $max (0, y - 1) = 0$ και $min (1, y) = y$ , άρα επικάλυψη $[0, y]$ , μήκος $y - 0 = y$ .
$1 \leq y \leq 2$ — το παράθυρο βγαίνει από δεξιά: $max (0, y - 1) = y - 1$ και $min (1, y) = 1$ , άρα επικάλυψη $[y - 1, 1]$ , μήκος $1 - (y - 1) = 2 - y$ .
$y < 0$ ή $y > 2$ — τα δύο διαστήματα δεν τέμνονται, μήκος $0$ . (Λογικό: $Y = X + N$ με $X, N \in [0, 1]$ , άρα το $Y$ ζει μόνο στο $[0, 2]$ .)

Συνολικά:

f_{Y} (y) = ⎩ ⎨ ⎧ y, 2 - y, 0, 0 \leq y \leq 1, 1 \leq y \leq 2, αλλι \overset{ω}{ˊ} ς.

Τριγωνική πυκνότητα στο $[0, 2]$ , με κορυφή στο $y = 1$ . Γρήγορος έλεγχος ότι στέκει: εμβαδόν $= \frac{1}{2} \cdot 2 \cdot 1 = 1$ . ✓

Το «δέσιμο» φαίνεται με γυμνό μάτι: το ίδιο το support συνδέει τα $x, y$ (για δοσμένο $x$ , το $y$ ζει μόνο στο $[x, x + 1]$ ), οπότε $f_{X, Y} \neq = f_{X} f_{Y}$ — εξαρτημένες, όπως το περιμέναμε αφού το $Y$ είναι το $X$ συν θόρυβο. Με Gaussian θόρυβο η ίδια ακριβώς διαδικασία δίνει ζεύγος jointly Gaussian, και η συνέλιξη δύο Gaussians ξαναβγάζει Gaussian με αθροισμένες variances — το «οι διασπορές προστίθενται» που θα ξαναδείς στον θόρυβο.

Το $E [X Y]$ και πώς πάντα «σπάει» σε δύο κομμάτια. Μόλις έχεις joint PDF, μπορείς να ορίσεις τον μέσο του γινομένου δύο ΤΜ, $E [X Y] = \iint x y f_{X, Y} (x, y) d x d y$ — η ποσότητα-κλειδί για δύο ΤΜ μαζί. Αξίζει να δεις από τώρα ότι πάντα σπάει σε δύο κομμάτια:

E [X Y] = γιν \overset{ο}{ˊ} μενο των μ \overset{ε}{ˊ} σων μ_{X} μ_{Y} + π \overset{ο}{ˊ} σο συν-κινο \overset{υ}{ˊ} νται γ \overset{υ}{ˊ} ρω απ \overset{ο}{ˊ} τους μ \overset{ε}{ˊ} σους Cov (X, Y), Cov (X, Y) ≜ E [(X - μ_{X}) (Y - μ_{Y})] .

Απόδειξη (μόνο linearity του $E$ , αφού οι $μ_{X}, μ_{Y}$ είναι σταθερές): άνοιξε το γινόμενο μέσα στον ορισμό του $Cov$ ,

Cov (X, Y) = E [X Y - μ_{X} Y - μ_{Y} X + μ_{X} μ_{Y}] = E [X Y] - μ_{X} μ_{Y} - μ_{Y} μ_{X} + μ_{X} μ_{Y} = E [X Y] - μ_{X} μ_{Y},

και αναδιατάσσοντας παίρνεις $E [X Y] = μ_{X} μ_{Y} + Cov (X, Y)$ .

Με λόγια: το $E [X Y]$ είναι το γινόμενο των μέσων ( $μ_{X} μ_{Y}$ , το σταθερό «DC» κομμάτι) συν το πόσο οι δύο ΤΜ ταλαντώνονται μαζί γύρω από τους μέσους τους ( $Cov$ ). Τι ακριβώς μετράει το $Cov$ και πώς το κανονικοποιούμε, το εξετάζουμε αναλυτικά στην §6γ· εδώ μας αρκεί η σχέση, γιατί κάνει την ανεξαρτησία που ακολουθεί να βγαίνει με μια κίνηση.

6β. Independence — το ισχυρότερο που μπορείς να πεις

Αυτή είναι ακριβώς η ειδική περίπτωση όπου η joint $f_{X, Y}$ (από την §6α) σπάει στο γινόμενο των δύο marginals. $X, Y$ είναι ανεξάρτητα αν και μόνο αν:

f_{X, Y} (x, y) = f_{X} (x) f_{Y} (y) για \overset{ο}{ˊ} λα τα x, y .

Συνδέεται απευθείας με τον κανόνα γινομένου της §6α: ανεξαρτησία σημαίνει ότι η δεσμευμένη πέφτει πάνω στην περιθώρια, $f_{X ∣ Y} (x ∣ y) = f_{X} (x)$ — δηλαδή το να ξέρεις την τιμή της $Y$ δεν αλλάζει καθόλου την κατανομή της $X$ . Βάζοντας $f_{X ∣ Y} = f_{X}$ στο γενικό $f_{X, Y} = f_{X ∣ Y} f_{Y}$ , καταρρέει αμέσως στο γινόμενο $f_{X} f_{Y}$ .

Με λόγια: όταν είναι ανεξάρτητα, η πλήρης 2D περιγραφή καταρρέει στο γινόμενο των δύο 1D κομματιών — ξέρεις τα πάντα για το ζεύγος ξέροντας μόνο το καθένα χωριστά. Όταν δεν είναι ανεξάρτητα, η $f_{X, Y}$ εξακολουθεί να υπάρχει κανονικά (ορίστηκε στην §6α για κάθε ζεύγος) — απλώς δεν παραγοντοποιείται, και τη χρειάζεσαι ολόκληρη για να περιγράψεις το ζεύγος.

Συνέπεια που θα χρησιμοποιήσεις διαρκώς:

E [X Y] = E [X] E [Y] (αν ανεξ \overset{α}{ˊ} ρτητα) .

Γιατί ισχύει; Γρήγορη απόδειξη — χρειάζεσαι μόνο τον ορισμό του μέσου (LOTUS για συνάρτηση δύο ΤΜ, εδώ $g (X, Y) = X Y$ ) και την ανεξαρτησία $f_{X, Y} = f_{X} f_{Y}$ :

E [X Y] = \iint x y f_{X, Y} (x, y) d x d y = \iint x y f_{X} (x) f_{Y} (y) d x d y = (\int x f_{X} (x) d x) (\int y f_{Y} (y) d y) = E [X] E [Y] .

Το κρίσιμο βήμα είναι το σπάσιμο του διπλού ολοκληρώματος: μόλις ο integrand γράφεται «κάτι μόνο με $x$ » επί «κάτι μόνο με $y$ » (το $x f_{X} (x)$ επί το $y f_{Y} (y)$ ), τα δύο ολοκληρώματα ξεχωρίζουν. Χωρίς ανεξαρτησία η $f_{X, Y}$ δεν παραγοντοποιείται και το σπάσιμο δεν γίνεται, οπότε η ανεξαρτησία δεν εγγυάται πια την ισότητα — είναι όμως ικανή συνθήκη, όχι αναγκαία.

Δες το και μέσα από τη σχέση $E [X Y] = μ_{X} μ_{Y} + Cov (X, Y)$ : αυτό που μόλις αποδείξαμε σημαίνει ότι η ανεξαρτησία μηδενίζει το $Cov$ — κόβει όλη τη συν-κίνηση και αφήνει μόνο το γινόμενο των μέσων, $E [X Y] = μ_{X} μ_{Y} = E [X] E [Y]$ . Άρα «ανεξάρτητες ⇒ $Cov = 0$ », δηλαδή ⇒ ασυσχέτιστες.

Πρόσεξε όμως την κατεύθυνση: το αντίστροφο δεν ισχύει. Η ισότητα (δηλαδή $Cov = 0$ , «ασυσχέτιστες») μπορεί να κρατάει και για ΤΜ εξαρτημένες αλλά ασυσχέτιστες. Δηλαδή η ανεξαρτησία είναι ο πιο εύκολος λόγος να την επικαλεστείς (όποτε σου δίνεται, μπες κατευθείαν), όχι ο μοναδικός· τη γενική εικόνα (ανεξάρτητες / ασυσχέτιστες / ορθογώνιες) τη χτίζουμε στην §6δ.

Αυτή η ισότητα είναι το «εργαλείο μηδενισμού» που εφαρμόζεις παντού στο κεφάλαιο της ετεροσυσχέτισης — αν οι δύο ΤΜ είναι ανεξάρτητες, η ετεροσυσχέτιση «κόβει» στο γινόμενο των μέσων (βλ. slide 18 — Άσκηση 1 λύση 4/5 των διαφανειών).

6γ. Covariance & correlation

Πρώτα, τι εννοούμε «γραμμική σχέση»: δύο ΤΜ έχουν γραμμική σχέση όταν η μία είναι, κατά προσέγγιση, ένα σταθερό πολλαπλάσιο της άλλης συν μια σταθερά — $Y \approx a X + b$ . Αν σχεδίαζες πολλά ζεύγη $(X, Y)$ ως σημεία σε άξονες, θα έπεφταν κοντά σε μια ευθεία γραμμή (ανηφορική αν $a > 0$ , κατηφορική αν $a < 0$ ). «Καμία γραμμική σχέση» σημαίνει ότι δεν υπάρχει τέτοια ευθεία τάση — προσοχή, όχι ότι δεν υπάρχει καμία σχέση (μπορεί κάλλιστα να υπάρχει καμπύλη, όπως $Y = X^{2}$ ).

Covariance — ο τρόπος να το μετρήσεις:

Cov (X, Y) = E [(X - μ_{X}) (Y - μ_{Y})] = E [X Y] - μ_{X} μ_{Y} .

Διάβασέ τον τύπο ως «έλεγχο»: για κάθε αποτέλεσμα κοιτάς αν το $X$ είναι πάνω ή κάτω από τον δικό του μέσο (το πρόσημο του $X - μ_{X}$ ) και το ίδιο για το $Y$ , και πολλαπλασιάζεις τις δύο αποκλίσεις.

Αν τα δύο τείνουν να είναι μαζί πάνω ή μαζί κάτω από τους μέσους τους, τα γινόμενα βγαίνουν κυρίως θετικά → $Cov > 0$ (ανηφορική ευθεία τάση).
Αν όταν το ένα ανεβαίνει το άλλο κατεβαίνει, τα γινόμενα είναι κυρίως αρνητικά → $Cov < 0$ (κατηφορική).
Αν δεν υπάρχει τέτοια συστηματική τάση, τα θετικά και τα αρνητικά γινόμενα αλληλοεξουδετερώνονται → $Cov \approx 0$ .

Correlation coefficient (συντελεστής συσχέτισης) — το πρόβλημα του covariance είναι ότι η τιμή του εξαρτάται από τις μονάδες/κλίμακα των $X, Y$ , οπότε σκέτο «μεγάλο» ή «μικρό» δεν λέει πόσο δυνατή είναι η σχέση. Το κανονικοποιούμε διαιρώντας με τα $σ_{X}, σ_{Y}$ :

ρ_{X Y} = \frac{Cov ( X , Y )}{σ _{X} σ _{Y}} \in [- 1, 1] .

Το $ρ$ είναι ο καθαρός «δείκτης γραμμικότητας» — πάντα ανάμεσα σε $- 1$ και $1$ , ανεξάρτητα από μονάδες:

$ρ = + 1$ : τέλεια ανηφορική ευθεία — τα σημεία πέφτουν ακριβώς πάνω σε γραμμή $Y = a X + b$ με $a > 0$ .
$ρ = - 1$ : τέλεια κατηφορική ευθεία ( $a < 0$ ).
$ρ = 0$ : καμία γραμμική τάση (γραμμικά ασύσχετα — όχι απαραίτητα ανεξάρτητα· βλ. trap παρακάτω).
ενδιάμεσα: όσο πιο κοντά στο $\pm 1$ , τόσο πιο «σφιχτά» μαζεμένα γύρω από μια ευθεία· όσο πιο κοντά στο $0$ , τόσο πιο θολή η ευθεία τάση.

Άρα «πώς ελέγχω αν υπάρχει γραμμική σχέση;»: υπολογίζεις το $Cov$ (ή, καθαρότερα, το $ρ$ ). Μη-μηδενικό → υπάρχει γραμμική τάση, και το πρόσημο δίνει την κατεύθυνση· μηδέν → καμία γραμμική τάση (αλλά, ξανά, μπορεί να κρύβεται καμπύλη σχέση — γι' αυτό «ασυσχέτιστες» δεν σημαίνει «ανεξάρτητες»).

Σύρε το $ρ$ στο παρακάτω interactive και δες τη γραμμική σχέση να «σφίγγει» γύρω από μια ευθεία ή να χαλαρώνει. Τα σημεία είναι χρωματισμένα με το πρόσημο του $(X - μ_{X}) (Y - μ_{Y})$ — ακριβώς το μέγεθος που μέσο-ποιεί το covariance — οπότε βλέπεις γιατί βγαίνει θετικό, αρνητικό ή μηδέν. Πάτα και το preset «Καμπύλη $Y = X^{2}$ »: η $Y$ καθορίζεται πλήρως από την $X$ (απόλυτη εξάρτηση) κι όμως το $ρ$ καταρρέει στο $\approx 0$ — η ζωντανή εκδοχή της παγίδας που έρχεται στην §6δ.

Γραμμική σχέση & covariance — δες πώς το ρ «βλέπει» ευθείες

ρ (συντελεστής συσχέτισης) = 0.70

ρ (από τα σημεία)

0.70

Cov πρόσημο

> 0 (ανηφορικά)

Σχέση;

γραμμική τάση

Κάθε σημείο είναι ένα ζεύγος (X, Y). Χρώμα = πρόσημο του (X−x̄)(Y−ȳ): πράσινο όταν τα δύο είναι μαζί πάνω/κάτω από τους μέσους τους (συμφωνούν), κόκκινο όταν διαφωνούν. Το Cov είναι ο μέσος όρος αυτών των γινομένων. Σύρε το ρ: στο ±1 όλα πέφτουν πάνω στην ευθεία· στο 0 πράσινα και κόκκινα ισορροπούν και η ευθεία τάση χάνεται.

6δ. Τρεις όροι που μπερδεύονται: ανεξάρτητες, ασυσχέτιστες, ορθογώνιες

Αυτές οι τρεις λέξεις ακούγονται συνώνυμες αλλά δεν είναι — και το να τις μπερδέψεις είναι από τις πιο συχνές πηγές λάθους σε Σ/Λ. Πρώτα οι ορισμοί, καθαρά:

Όρος	Ορισμός	Πώς το ελέγχεις στην πράξη
Ανεξάρτητες	$f_{X, Y} (x, y) = f_{X} (x) f_{Y} (y)$ για κάθε $x, y$	δες αν η joint PDF παραγοντοποιείται σε γινόμενο των δύο marginals
Ασυσχέτιστες	$Cov (X, Y) = 0$ , δηλ. $E [X Y] = E [X] E [Y]$	υπολόγισε $E [X Y]$ και σύγκρινέ το με το $E [X] E [Y]$
Ορθογώνιες	$E [X Y] = 0$	υπολόγισε $E [X Y]$ και δες αν βγαίνει $0$

Δύο σχέσεις συνδέουν αυτούς τους όρους — μία «κάθετη» (πόσο δυνατή συνθήκη) και μία «οριζόντια» (η διαφορά τους):

(1) Κάθετα — από το πιο δυνατό στο πιο αδύνατο: ανεξάρτητες ⇒ ασυσχέτιστες, και ισχύει πάντα (αν παραγοντοποιείται η joint, τότε $E [X Y] = E [X] E [Y]$ , άρα $Cov = 0$ ). Το αντίστροφο όμως δεν ισχύει γενικά: ασυσχέτιστες ⇏ ανεξάρτητες — εκτός αν οι ΤΜ είναι jointly Gaussian (δηλαδή η από κοινού κατανομή τους $f_{X, Y}$ είναι Gaussian — όχι απλώς η καθεμία ξεχωριστά), οπότε μόνο τότε ταυτίζονται οι δύο έννοιες.

(2) Οριζόντια — ασυσχέτιστες vs ορθογώνιες: δεν είναι το ίδιο. Διαφέρουν ακριβώς κατά τον όρο $E [X] E [Y]$ , αφού $Cov (X, Y) = E [X Y] - E [X] E [Y]$ . Άρα οι δύο συνθήκες (« $Cov = 0$ » και « $E [X Y] = 0$ ») γίνονται η ίδια ακριβώς όταν $E [X] E [Y] = 0$ — δηλαδή όταν τουλάχιστον μία από τις δύο ΤΜ έχει μηδενικό μέσο. Στα συστήματα επικοινωνιών ο θόρυβος είναι σχεδόν πάντα zero-mean, οπότε εκεί «ασυσχέτιστες» και «ορθογώνιες» τις περισσότερες φορές συμπίπτουν — γι' αυτό είναι εύκολο να ξεχάσεις ότι γενικά είναι ξεχωριστές.

Η ορθογωνιότητα ( $E [X Y] = 0$ ) δεν είναι ακαδημαϊκή λεπτομέρεια: όταν προσθέτεις δύο σήματα, ο σταυρωτός όρος στη μέση ισχύ είναι $E [(X + Y)^{2}] = E [X^{2}] + E [Y^{2}] + 2 E [X Y]$ , και το $2 E [X Y]$ μηδενίζεται ακριβώς όταν οι δύο είναι ορθογώνιες — τότε η ισχύς του αθροίσματος είναι το άθροισμα των δύο ισχύων (η αιτία του +3 dB στην άσκηση «Gaussian» πιο κάτω).

Joint, independence, covariance σε μία ανάσα

Λέξεις-κλειδιά

f_{X,Y} = f_X · f_Y ⇔ ανεξάρτητες
E[XY] = E[X]·E[Y] (αν ανεξάρτητες)
Cov = E[XY] − μ_X μ_Y
ρ ∈ [−1, 1]
indep ⇒ uncorr, αντίστροφο μόνο Gaussian

Βήματα

Πρώτα ρωτάς: μου έδωσαν ανεξαρτησία ως δεδομένο; Αν ναι, χρησιμοποίησε E[XY] = E[X]E[Y].
Αν χρειάζεσαι covariance: υπολόγισε E[XY] με ολοκλήρωμα 2 διαστάσεων, μετά αφαίρεσε μ_X μ_Y.
Αν χρειάζεσαι correlation coefficient: διαίρεσε με σ_X σ_Y.
Όταν η εκφώνηση λέει «ασυσχέτιστες», μην παραπληροφορηθείς ότι είναι ανεξάρτητες — δες αν είναι Gaussian.

Η συχνότερη παγίδα

Το να πεις «uncorrelated άρα independent» χωρίς να ελέγξεις πρώτα ότι οι ΤΜ είναι jointly Gaussian είναι το πιο συχνό λάθος σε Σ/Λ προβλήματα.

7. LOTUS — υπολόγισε E[g(X)] χωρίς να βρεις την κατανομή του g(X)

Αν $Y = g (X)$ είναι μια ντετερμινιστική συνάρτηση μιας ΤΜ, τότε:

E [g (X)] = \int_{- \infty}^{\infty} g (x) f_{X} (x) d x .

Αυτό λέγεται Law of the Unconscious Statistician (LOTUS) — δεν χρειάζεται να βρεις πρώτα τη $f_{Y} (y)$ . Απλώς πολλαπλασιάζεις τη $g (x)$ με τη γνωστή σου $f_{X} (x)$ και ολοκληρώνεις.

Δύο σχεδόν-κανόνες που θα τους δεις παντού: για $Θ \sim U (0, 2 π)$ ,

E [cos Θ] = \int_{0}^{2 π} cos θ \cdot \frac{1}{2 π} d θ = 0

και

E [cos^{2} Θ] = \int_{0}^{2 π} cos^{2} θ \cdot \frac{1}{2 π} d θ = \frac{1}{2} .

Γιατί τα ξεχωρίζουμε; Γιατί είναι οι δύο συχνότερες ταυτότητες σε όλη τη θεωρία τυχαίων σημάτων του K21. Κάθε φορά που θα δεις $A cos (2 π f_{0} t + Θ)$ με $Θ$ uniform, αυτές οι δύο ταυτότητες θα είναι ακριβώς στην καρδιά του υπολογισμού.

8. Πώς συνδέεται με τις τυχαίες διαδικασίες

Αυτή είναι η πιο σημαντική παράγραφος της σελίδας — γιατί όλο το επόμενο κεφάλαιο χτίζεται πάνω στο πέρασμα ΤΜ → ΤΔ.

Παράδειγμα — Άσκηση 1 από τις διαφάνειες (slides 14–19):

Έστω η ΤΔ $X (t) = A cos (2 π f_{1} t + ϕ)$ με $A$ , $f_{1}$ σταθερές και $ϕ \sim U [0, π]$ :

f_{ϕ} (ϕ) = {1/ π, 0, ϕ \in [0, π] αλλο \overset{υ}{ˊ} .

Πώς υπολογίζεις τον μέσο $m_{X} (t)$ της ΤΔ; Σε σταθερό $t$ , η $X (t)$ είναι μια ΤΜ (που ως μοναδική πηγή τυχαιότητας έχει την $ϕ$ ). Άρα ο μέσος είναι LOTUS με $g (ϕ) = A cos (2 π f_{1} t + ϕ)$ και $f_{ϕ} (ϕ) = 1/ π$ :

m_{X} (t) = \int_{0}^{π} A cos (2 π f_{1} t + ϕ) \frac{1}{π} d ϕ = \frac{A}{π} [sin (2 π f_{1} t + ϕ)]_{0}^{π} = \frac{A}{π} [sin (2 π f_{1} t + π) - sin (2 π f_{1} t)] = \frac{A}{π} [- sin (2 π f_{1} t) - sin (2 π f_{1} t)] = - \frac{2 A}{π} sin (2 π f_{1} t) .

(Slide 15, ακριβώς αυτή η ροή.)

Παρατήρησε: η ΤΜ-μηχανή που χρησιμοποιήσαμε ήταν LOTUS + ολοκλήρωμα της PDF του $ϕ$ . Καμία «νέα» ιδέα — απλώς οι §§ 3-7 σε εφαρμογή.

X(t) = A cos(2π f₁ t + φ), φ ~ U[0, π] — η time-slice είναι ΤΜ με PDF

Πάνω: realizations με τυχαία φάση φ ~ U[0, π] — κάθε γραμμή ένα ντετερμινιστικό cosine. Σύρε την time-slice: σε σταθερό t «τέμνεις» τις realizations και παίρνεις την ΤΜ X(t). Κάτω: το ιστόγραμμα των τιμών της — όσες περισσότερες realizations μετράς, τόσο καθαρότερα σχηματίζεται η PDF της X(t). Η κόκκινη γραμμή είναι ο μέσος m_X(t) = E[X(t)] — ακριβώς ό,τι υπολογίζει το LOTUS παραπάνω.

Time-slice t = 0.50 s

Μέσος της time-slice: εμπειρικά (από το ιστόγραμμα) 0.012 · θεωρητικά (LOTUS) −(2A/π)·sin(2π f₁ t) = -0.000. Σύρε το t και δες ότι ο μέσος αλλάζει με τον χρόνο (δεν είναι 0) — γι' αυτό αυτή η ΤΔ δεν έχει σταθερό μέσο.

Πώς να διαβάσεις το viz — δες δύο άξονες:

Οριζόντια (κάθε γραμμή ξεχωριστά): μία «realization» — μία πραγματοποίηση του τυχαίου πειράματος (μία τιμή της $ϕ$ ), που δίνει ένα συγκεκριμένο cosine.
Κάθετα (μία στιγμή $t$ ): «τέμνεις» τις realizations σε σταθερό $t$ και παίρνεις την ΤΜ $X (t)$ . Η ιστογραμμική κατανομή αυτών των τιμών είναι η PDF της $X (t)$ — και είναι αυτή που χρησιμοποιεί το LOTUS για να βρει $m_{X} (t), R_{X} (t_{1}, t_{2}), \dots$

9. Σύνοψη τύπων

Έννοια	Τύπος
CDF	$F_{X} (x) = P (X \leq x)$
PDF	$f_{X} (x) = d F_{X} / d x$ , $\int f_{X} = 1$
PMF (διακριτές)	$P (X = x_{i}) = p_{i}$ , $\sum p_{i} = 1$
Mean	$μ_{X} = \int x f_{X} d x$ (ή $m_{X}$ — ίδιο πράγμα)
Mean square	$E [X^{2}] = \int x^{2} f_{X} d x$
Variance	$σ_{X}^{2} = E [X^{2}] - μ_{X}^{2}$
Linearity (πάντα)	$E [a X + bY] = a E [X] + b E [Y]$
Variance sum	$Var (a X + bY) = a^{2} Var (X) + b^{2} Var (Y) + 2 ab Cov (X, Y)$
Covariance	$Cov (X, Y) = E [X Y] - μ_{X} μ_{Y}$
Independence	$f_{X, Y} = f_{X} \cdot f_{Y}$
Indep ⇒ uncorrelated	(πάντα)
Uncorrelated ⇒ indep	(μόνο για Gaussian)
LOTUS	$E [g (X)] = \int g (x) f_{X} (x) d x$
$E [cos Θ], Θ \sim U (0, 2 π)$	$= 0$
$E [cos^{2} Θ], Θ \sim U (0, 2 π)$	$= 1/2$

10. Εξάσκηση

0 / 6 λυμένα

Έξι ασκήσεις πάνω στις τυχαίες μεταβλητές. Οι πέντε πρώτες δοκιμάζουν τις βασικές ταυτότητες· η έκτη είναι η γέφυρα προς το επόμενο κεφάλαιο — εφαρμόζει LOTUS στην ΤΔ της Άσκησης 1 των διαφανειών.

11. Ανακάλεσε — drills

Βάλε τα βήματα στη σωστή σειρά

Βάλε στη σωστή σειρά τα 5 βήματα για να υπολογίσεις τον μέσο μιας ΤΔ με τυχαία φάση μέσω LOTUS:

Σύρε τις γραμμές για αναδιάταξη — ή χρησιμοποίησε τα βελάκια .

1.
Διαβάζω αν ο μέσος εξαρτάται από t — αν ναι, δεν είναι σταθερός, άρα η ΤΔ δεν είναι «στάσιμη ως προς τη μέση τιμή» (κριτήριο WSS, στο επόμενο κεφάλαιο).
2.
Ολοκληρώνω (αντιπαραγωγή της g θεωρώντας t σταθερό).
3.
Στήνω το LOTUS integral: ∫ g(φ) f_φ(φ) dφ πάνω στο support της φ (το διάστημα τιμών όπου f_φ ≠ 0).
4.
Αναγνωρίζω την πηγή τυχαιότητας της ΤΔ (π.χ. μία ΤΜ φ).
5.
Σε σταθερό t, γράφω την X(t) ως g(φ) — μία ντετερμινιστική συνάρτηση της φ.

Συμπλήρωσε τα κενά

Συμπλήρωσε τις βασικές ιδιότητες:

PDF: ολικό εμβαδόν κάτω από την f_X είναι . Variance: σ² = E[X²] − . Linearity E[aX+bY] = aE[X]+bE[Y] χρειάζεται . Variance sum Var(X+Y) = Var(X) + Var(Y) χρειάζεται . Uncorrelated ⇒ independent ισχύει μόνο για .

Ανακάλεσε από μνήμη

Από μνήμη: γράψε μέσο και variance για Uniform U(a,b), Gaussian N(μ,σ²), και Exponential(λ). Επίσης: ποιο E[cos Θ] και ποιο E[cos² Θ] για Θ ~ U(0, 2π);

12. Αναγνώρισε — όταν δεις αυτές τις φράσεις στην εξέταση

Πώς θα το αναγνωρίσεις

Αν δεις στην εκφώνηση

«τυχαία φάση φ ~ U[…]»
«δοθείσα PDF f_X(x)»
«E[g(X)] = ?»
«άθροισμα ανεξάρτητων Gaussians»
«E[X²] zero-mean θόρυβος»
«λευκός vs Gaussian θόρυβος»
«ασυσχέτιστες αλλά εξαρτημένες»

«τυχαία φάση φ ~ U[…]» → πάει εκεί όπου εφαρμόζεις LOTUS με $g (ϕ)$ = το cosine/sine που σου δίνεται. Δες την «slide-15-bridge» άσκηση πάνω για το βήμα-βήμα.
«δοθείσα PDF» → ζητάει mean/variance/πιθανότητα. Όχι τύπος-από-καρδιάς· πρώτα ελέγχεις αν η εκφώνηση σου δίνει την PDF ή απλώς το όνομα της κατανομής (Gaussian/Uniform/Exponential).
«E[g(X)]» → LOTUS. Μη μπεις στον πειρασμό να βρεις πρώτα την κατανομή του $g (X)$ .
«άθροισμα ανεξάρτητων Gaussians» → μέσος προσθέτεται γραμμικά, διασπορά προστίθεται (όχι √ άθροισμα — αυτό είναι το σ). Σε dB: +3 dB ανά διπλασιασμό.
«E[X²] zero-mean» → ισούται με $σ^{2}$ . Συχνά λύση SNR.
«λευκός θόρυβος» vs «Gaussian θόρυβος» → δύο διαφορετικές ιδιότητες. Σ/Λ ερωτήσεις δοκιμάζουν αυτή την παγίδα κάθε χρόνο.
«ασυσχέτιστες» → όχι αυτόματα ανεξάρτητες. Έλεγξε αν είναι Gaussian πρώτα.

Πού οι ΤΜ-έννοιες εμφανίζονται στα παλιά θέματα

13. Πού θα χρειαστείς αυτές τις έννοιες αργότερα

/randomness/random-processes — κάθε $m_{X} (t)$ , $R_{X} (t_{1}, t_{2})$ , $C_{X}$ θα υπολογιστεί με LOTUS πάνω στις παραμέτρους τυχαιότητας της ΤΔ (όπως είδαμε στην slide-15-bridge άσκηση). Αυτό είναι το αμέσως επόμενο κεφάλαιο.
/randomness/stationarity — η συνθήκη WSS είναι «μέσος σταθερός στο χρόνο, αυτοσυσχέτιση εξαρτάται μόνο από τη χρονική διαφορά $τ$ ». Η §4α (mean) και η §3 (PDF/CDF) σου δίνουν τις στατιστικές που πρέπει να σταθεροποιηθούν.
/randomness/psd — η Wiener-Khinchin είναι ο Fourier transform της autocorrelation $R_{X} (τ)$ . Η $R_{X}$ είναι το $E [X (t) X (t + τ)]$ — πάλι ΤΜ-εκφώνηση πάνω στο joint distribution των $X (t), X (t + τ)$ (§6α).
/noise/sources — ο θερμικός θόρυβος έχει Gaussian κατανομή πλάτους (§5β). Το γιατί ακριβώς Gaussian (CLT) είναι load-bearing για το AWGN μοντέλο.
/noise/through-filters — Gaussian θόρυβος μέσα από LTI παραμένει Gaussian. Αυτή είναι μια κρίσιμη ιδιότητα της Gaussian κατανομής (συνεπώς της §5β) που χρησιμοποιείται διαρκώς.
/noise/bandpass — οι I/Q συνιστώσες του bandpass θορύβου είναι κάθε μία Gaussian και ανεξάρτητες μεταξύ τους — εδώ ο συνδυασμός §5β (Gaussian) + §6β (independence) πληρώνει.
/am/modulator-demodulator — η ανάλυση AM-σήματος μέσα σε θόρυβο χρησιμοποιεί $E [n^{2} (t)] = σ_{n}^{2}$ (§4β-§5β) ως ισχύ θορύβου στο SNR.

14. Συμπύκνωσε — όλο το κεφάλαιο

Συμπύκνωσε όλο το κεφάλαιο

Λέξεις-κλειδιά

PDF f_X(x), εμβαδόν = 1
μέσος μ = ∫x f_X, διασπορά σ² = E[X²] − μ²
LOTUS: E[g(X)] = ∫g(x) f_X(x) dx
Uniform: U(0,2π) μηδενίζει cos
Gaussian: AWGN, CLT, σ² = ισχύς zero-mean
Linearity πάντα, Var-sum υπό Cov=0
Indep ⇒ uncorr (αντίστροφο μόνο Gaussian)
ΤΜ → ΤΔ: LOTUS σε σταθερό t

Βήματα

Δες αν σου δίνουν PDF ή απλώς κατανομή — αν δεύτερο, ανέκαλεσε τύπους από §5.
Για μέσο/διασπορά μιας ΤΜ: ολοκληρώματα §4· για E[g(X)]: LOTUS §7.
Για άθροισμα ΤΜ: linearity για mean (πάντα), Cov ελέγχει το cross term για variance.
Για 2 ΤΜ: γράφε joint, έλεγξε independence, υπολόγισε Cov με E[XY] − μ_X μ_Y.
Για ΤΔ X(t): σε σταθερό t είναι ΤΜ → εφάρμοσε §§3-7 πάνω στην παράμετρο τυχαιότητας.
Αναγνώρισε τις Σ/Λ παγίδες: λευκός ≠ Gaussian, uncorr ≠ indep (εκτός Gaussian).

Η συχνότερη παγίδα

Δύο επικίνδυνες ταυτίσεις: (α) «λευκός» με «Gaussian» — είναι δύο διαφορετικές ιδιότητες (φασματική vs αμπλιτουδική), και (β) «ασυσχέτιστες» με «ανεξάρτητες» — η ισοδυναμία ισχύει μόνο για jointly Gaussian.

Τι μάθαμε

Μια τυχαία μεταβλητή χαρακτηρίζεται πλήρως από την PDF (ή CDF). Από αυτές παίρνεις mean, variance, και κάθε άλλη στατιστική.
Οι σημαντικότερες κατανομές για το K21: Uniform (τυχαία φάση), Gaussian (θερμικός θόρυβος, CLT).
LOTUS είναι ο πιο χρήσιμος τύπος του κεφαλαίου — $E [g (X)] = \int g (x) f_{X} (x) d x$ χωρίς να βρεις πρώτα την κατανομή του $g (X)$ .
Linearity πάντα ισχύει για mean, αλλά για variance χρειάζεσαι Cov = 0.
Independence ⇒ zero covariance, αλλά zero covariance δεν συνεπάγεται γενικά independence (εκτός από Gaussian).
Δύο Σ/Λ παγίδες: «λευκός θόρυβος» ≠ «Gaussian θόρυβος», «ασυσχέτιστες» ≠ «ανεξάρτητες» γενικά.
Η γέφυρα προς το επόμενο κεφάλαιο: για κάθε ΤΔ $X (t)$ , σε σταθερό $t$ είναι ΤΜ — εφαρμόζεις LOTUS πάνω στην παράμετρο τυχαιότητας (slide 15 derivation).

Επόμενο

Random processes

Τελείωσες αυτή τη σελίδα;

Φόρτωση σχολίων…

Random variables — γρήγορος οδηγός

1. Νιώσε

2. Τι είναι μια τυχαία μεταβλητή

3. CDF και PDF — η ταυτότητα μιας ΤΜ

3α. CDF (cumulative distribution function)

3β. PDF (probability density function)

3γ. Η ίδια ιδέα για διακριτές ΤΜ — PMF

4. Mean, variance, και ισχύς

4α. Expectation (μέσος, mean)

4β. Variance (διασπορά)

4γ. Linearity — και τα όριά της

5. Κύριες κατανομές που θα συναντήσεις

Κύριες κατανομές — PDF, μέσος, διασπορά

5α. Uniform U(a, b)

5β. Gaussian / Normal N(μ,σ2)

5γ. Exponential(λ)

5δ. Bernoulli, Binomial, Poisson

6. Joint distributions, independence, covariance

6α. Joint PDF

6β. Independence — το ισχυρότερο που μπορείς να πεις

6γ. Covariance & correlation

Γραμμική σχέση & covariance — δες πώς το ρ «βλέπει» ευθείες

6δ. Τρεις όροι που μπερδεύονται: ανεξάρτητες, ασυσχέτιστες, ορθογώνιες

7. LOTUS — υπολόγισε E[g(X)] χωρίς να βρεις την κατανομή του g(X)

8. Πώς συνδέεται με τις τυχαίες διαδικασίες

X(t) = A cos(2π f₁ t + φ), φ ~ U[0, π] — η time-slice είναι ΤΜ με PDF

9. Σύνοψη τύπων

10. Εξάσκηση

11. Ανακάλεσε — drills

12. Αναγνώρισε — όταν δεις αυτές τις φράσεις στην εξέταση

13. Πού θα χρειαστείς αυτές τις έννοιες αργότερα

14. Συμπύκνωσε — όλο το κεφάλαιο

Τι μάθαμε

5β. Gaussian / Normal $N (μ, σ^{2})$

5γ. Exponential $(λ)$