eksperyment 13eksperyment 13

Co to zbiasowane dane? Stronnicze lub niesprawiedliwe dane

BIAS – stronniczość / niesprawiedliwość

Zbajasowane dane to po prostu niewłaściwie dobrane dane. Każdy model musimy zasilić danymi, w pierwszej kolejności, co widać na diagramie powyżej, zbieramy dane, następnie je łączymy, dobieramy i czyścimy. Na tym właśnie etapie należy zadbać – czyli odpowiednio przemyśleć i zaplanować – jakie dane dostarczymy do modelu. Algorytmy szukające rozwiązań, korelacji między danymi mogą wysnuć mylne wnioski bazując na nieodpowiednich danych, np.: gdy pracujemy nad modelem, który ma za zadanie zaproponowanie odpowiednich osób na stanowiska w firmie i dostarczymy mu dane historyczne z okresu 50lat gdzie kobiety rzadziej zajmowały określone stanowiska (a de facto rzadziej pracowały) model może uznać, że kobiety nie nadają się do wykonywania określonych prac.
Dlatego tak istotne jest dobranie odpowiednich danych, w powyższym przypadku należało zastanowić się czy np. dane o płci, czy okres, z którego dostarczamy dane były odpowiednie. Nie tylko płeć, ale np. rasa czy określone zachowania mogą być danymi stronniczymi, które wpłyną ostatecznie na jakość modelu.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

@wrukwiony on Instagram
[instagram-feed feed=1]

Press ESC to close