- 1. Die Biostatistik ist ein Teilgebiet der Statistik, das sich mit Daten über lebende Organismen befasst. Sie befasst sich mit dem Entwurf, der Analyse und der Interpretation von Daten in Bereichen wie Biologie, Medizin, öffentliche Gesundheit und Umweltwissenschaften. Die Biostatistik spielt eine entscheidende Rolle bei Forschungsstudien, klinischen Versuchen und Initiativen im Bereich der öffentlichen Gesundheit, indem sie statistische Methoden zur Analyse von Daten, zum Ziehen von Schlussfolgerungen und zum Treffen fundierter Entscheidungen bereitstellt. Sie hilft dabei, Krankheitsmuster zu verstehen, Risikofaktoren zu ermitteln, Behandlungsmaßnahmen zu bewerten und gesundheitliche Ergebnisse vorherzusagen. Biostatistiker nutzen ihr Fachwissen über statistische Theorien und Methoden, um komplexe Forschungsfragen zu beantworten und zu Fortschritten in der Gesundheitswissenschaft und -politik beizutragen.
Was ist der Zweck von Hypothesentests in der Biostatistik?
A) Schätzung des Mittelwerts der Grundgesamtheit. B) Eine Hypothese mit 100%iger Sicherheit zu beweisen. C) Um festzustellen, ob es genügend Beweise gibt, um eine Nullhypothese zu verwerfen. D) Zur Berechnung der Standardabweichung.
- 2. Welche Rolle spielt die Kontrollgruppe in einer klinischen Studie?
A) Daten von den Teilnehmern zu sammeln. B) Verabreichung der Behandlung an die Teilnehmer. C) Bereitstellung einer Basislinie für den Vergleich mit der Behandlungsgruppe. D) Analyse der Ergebnisse.
- 3. Welche Art von Studiendesign ist am besten geeignet, um Ursache-Wirkungs-Beziehungen zu ermitteln?
A) Randomisierte, kontrollierte Studie B) Beobachtungsstudie C) Fall-Kontroll-Studie D) Querschnittliche Studie
- 4. Was bedeutet Sensitivität im Zusammenhang mit diagnostischen Tests?
A) Der Anteil wahrer positiver Ergebnisse unter allen Personen mit der Krankheit. B) Der Anteil der falsch positiven Ergebnisse. C) Der Anteil wahrer negativer Ergebnisse unter allen Personen ohne die Erkrankung. D) Der Anteil der falsch negativen Ergebnisse.
- 5. Bei welcher Art von Stichprobenverfahren wird eine Grundgesamtheit in Untergruppen unterteilt und dann eine Stichprobe aus jeder Untergruppe gezogen?
A) Stratifizierte Stichproben B) Einfache Zufallsstichprobe C) Cluster-Stichproben D) Systematische Probenahme
- 6. Welcher statistische Test kann verwendet werden, um mehr als zwei Gruppenmittelwerte zu vergleichen?
A) ANOVA B) Zwei-Stichproben-t-Test C) Gepaarter t-Test D) Chi-Quadrat-Test
- 7. Was besagt der p-Wert bei Hypothesentests?
A) Die Wahrscheinlichkeit, unter der Annahme, dass die Nullhypothese wahr ist, Ergebnisse zu erhalten, die genauso extrem sind wie die beobachteten Ergebnisse. B) Die Stärke der Beziehung zwischen den Variablen. C) Der für die Studie erforderliche Stichprobenumfang. D) Das Konfidenzintervall der Schätzung.
- 8. Was ist der Zweck der Regressionsanalyse?
A) Schätzung von Populationsparametern. B) Untersuchung der Beziehung zwischen einer abhängigen Variable und einer oder mehreren unabhängigen Variablen. C) Zur Berechnung der Wahrscheinlichkeiten. D) Zur Ermittlung der zentralen Tendenz.
- 9. Wie wird Biostatistik auch bezeichnet?
A) Biomathematik B) Biomechanik C) Biometrie D) Bioinformatik
- 10. Welches Fachgebiet steht in engem Zusammenhang mit der medizinischen Statistik?
A) Epidemiologie B) Biostatistik C) Pathologie D) Pharmakologie
- 11. Wer hat die Genetik begründet, indem er die Vererbungsmuster in Erbsenpflanzen untersuchte?
A) Francis Galton B) Gregor Mendel C) Charles Darwin D) William Bateson
- 12. Wer widersprach Francis Galtons Theorien zur Vererbung entschieden?
A) Arthur Dukinfield Darbishire B) Raphael Weldon C) William Bateson D) Karl Pearson
- 13. Welche Gruppe unterstützte Mendels Ideen zur Vererbung?
A) Neo-Darwinisten B) Biometristen C) Darwinisten D) Mendelisten
- 14. Wer hat die Konzepte der ANOVA (Varianzanalyse) und des p-Wertes entwickelt?
A) J. B. S. Haldane B) Sewall G. Wright C) Ronald Fisher D) Betty Allan
- 15. Wer hat die F-Statistiken und die Methoden zur Berechnung entwickelt?
A) Sewall G. Wright B) Betty Allan C) J. B. S. Haldane D) Ronald Fisher
- 16. Welchen Mechanismus der Evolution hat das Buch von J. B. S. Haldane wieder als den wichtigsten etabliert?
A) Natürliche Selektion B) Genaustausch C) Mutation D) Genetische Drift
- 17. Wer hat den Taschenrechner "Friden" aus seiner Abteilung am Caltech verboten?
A) Ronald Fisher B) Sewall G. Wright C) J. B. S. Haldane D) Thomas Hunt Morgan
- 18. Welche der folgenden Optionen ist KEIN grundlegendes Prinzip der experimentellen Statistik?
A) Zufallsverteilung B) Lokale Kontrolle C) Bestimmung der Stichprobengröße D) Wiederholung
- 19. Was sollte bei der Formulierung einer Forschungsfrage berücksichtigt werden?
A) Eine umfassende Literaturrecherche. B) Aspekte der Datenanalyse. C) Kostenüberlegungen. D) Das Studiendesign.
- 20. Welcher Aspekt der Forschungsplanung beinhaltet die Definition, wie eine wissenschaftliche Frage gestellt werden soll?
A) Die Forschungsfrage. B) Perspektiven der Datenanalyse. C) Die damit verbundenen Kosten. D) Experimentelles Design.
- 21. Welches Prinzip der experimentellen Statistik hilft, Verzerrungen zu vermeiden?
A) Zufallsallokation B) Kostenabschätzung C) Lokale Kontrolle D) Replikation
- 22. Welcher ist laut dem Text der erste Schritt bei der Formulierung einer Forschungsfrage?
A) Die Methoden zur Datenerhebung festlegen. B) Die Kosten schätzen. C) Das Design des Experiments entwerfen. D) Eine umfassende Literaturrecherche durchführen.
- 23. Welchen Nutzen hat eine klar formulierte Forschungsfrage für die wissenschaftliche Gemeinschaft?
A) Sie reduziert den Bedarf an Wiederholungen von Studien. B) Sie vereinfacht die Datenanalyse. C) Sie schafft Mehrwert durch neue Erkenntnisse. D) Sie minimiert die Kosten.
- 24. Welcher Aspekt der Forschungsplanung beinhaltet die Festlegung, wie Daten gesammelt werden sollen?
A) Methoden zur Datenerhebung. B) Formulierung der Forschungsfrage. C) Kostenabschätzung. D) Hypothesenprüfung.
- 25. Welche Achse stellt in einem Liniendiagramm typischerweise die Zeit dar?
A) Die vertikale Achse B) Die horizontale Achse C) Die Zeit wird in einem Liniendiagramm nicht dargestellt D) Beide Achsen stellen die Zeit gleichermaßen dar
- 26. Wer hat Histogramme als grafische Darstellung eingeführt?
A) Karl Pearson B) Francis Galton C) Ronald Fisher D) John Tukey
- 27. Welche Art von Diagramm eignet sich am besten, um Veränderungen im Zeitverlauf darzustellen?
A) Balkendiagramm B) Histogramm C) Liniendiagramm D) Kreisdiagramm
- 28. Wie lautet die Formel zur Berechnung der Gesamtzahl der Beobachtungen (N) in einer Häufigkeitstabelle?
A) N = f1 + f2 + f3 + ... + fn B) N = fi * N C) N = fi / N D) N = fi - N
- 29. Wie wird ein Streudiagramm auch genannt?
A) Kreisdiagramm B) Streudiagramm C) Histogramm D) Balkendiagramm
- 30. Welches Symbol repräsentiert den arithmetischen Mittelwert in mathematischer Notation?
A) Σ B) n C) x̄ D) i
- 31. Wie nennt man ein Streudiagramm noch?
A) Balkendiagramm B) Kreisdiagramm C) Streudiagramm D) Liniendiagramm
- 32. In der Formel für den arithmetischen Mittelwert, was repräsentiert das Symbol '∑'?
A) Summe B) Differenz C) Produkt D) Division
- 33. Was repräsentiert ein Signifikanzniveau (α) bei Hypothesentests?
A) Der Korrelationskoeffizient zwischen zwei Variablen. B) Der Wertebereich für ein Konfidenzintervall. C) Die Wahrscheinlichkeit, dass die Nullhypothese wahr ist. D) Die akzeptable Fehlerrate bei der Entscheidung über statistische Signifikanz.
- 34. Was bedeutet ein Pearson-Korrelationskoeffizient von -1?
A) Keine lineare Korrelation B) Eine perfekte positive Korrelation C) Eine perfekte negative Korrelation D) Eine nicht definierte Beziehung
- 35. Welche biostatistische Methode hilft bei der Reduzierung der Variablendimension durch die Transformation von Prädiktoren in eine kleinere Menge unkorrelierter Komponenten?
A) Hauptkomponentenanalyse B) Lineare Regression C) Logistische Regression D) Analyse der Gen-Enrichment
- 36. Wie nennt man die hohe Korrelation zwischen Prädiktoren in biostatistischen Kontexten?
A) Dimensionsreduktion B) Hauptkomponentenanalyse C) Multikollinearität D) Anreicherung von Genmengen
- 37. Welche Methode berücksichtigt die Veränderung ganzer Gen-Gruppen anstatt einzelner Gene?
A) Lineare Diskriminanzanalyse B) Hauptkomponentenanalyse C) Sequenzierung der nächsten Generation D) Analyse der Gen-Enrichment (Gene Set Enrichment Analysis, GSEA)
- 38. Welche Datenbank konzentriert sich auf SNPs?
A) PubMed B) dbSNP C) Gene Ontology D) KEGG
- 39. Welche Datenbank ist speziell für Arabidopsis thaliana vorgesehen?
A) KEGG B) TAIR C) dbSNP D) Phytozome
- 40. Welche wichtige Initiative verknüpft Daten von DDBJ, EMBL-EBI und NCBI?
A) Bioinformatik-Datenkonsortium B) Globale Genom-Initiative C) Weltweites Datenaustauschprogramm D) Internationale Zusammenarbeit von Nukleotidsequenzdatenbanken (INSDC)
- 41. Welche Datenbank speichert Assemblierungen und Annotationsdateien von Dutzenden von Pflanzengenomen?
A) KEGG B) TAIR C) Phytozome D) dbSNP
- 42. Welche Datenbank wird für die Indexierung wissenschaftlicher Artikel verwendet?
A) dbSNP B) KEGG C) Gene Ontology D) PubMed
- 43. Welche biostatistische Methode hat für die statistische Klassifizierung an Popularität gewonnen?
A) Resampling-Methoden B) Entscheidungsbäume C) Zufallssträucher (Random Forests) D) Bootstrapping
- 44. In welchem Bereich ist die Gestaltung und Analyse klinischer Studien besonders wichtig?
A) Tierzucht B) Systemmedizin C) Quantitative Genetik D) Öffentliche Gesundheit
- 45. Welcher Algorithmus wird nicht üblicherweise in der QTL-Analyse (Quantitative Trait Loci-Analyse) verwendet?
A) Kompositives Intervall-Mapping B) Keine der oben genannten C) Intervall-Mapping D) Mehrfach-Intervall-Mapping
- 46. Worauf basiert eine genomweite Assoziationsstudie (GWAS)?
A) Quantitative Merkmalsorte. B) Genomische Selektion. C) Rekombinationshäufigkeit. D) Vererbungsungleichgewicht.
- 47. Was ist das Ziel der markergestützten Selektion?
A) Quantitativer Merkmalsabbau. B) Modelle für die genomische Selektion. C) Systeme zur Unterstützung klinischer Entscheidungen. D) Ergebnisse der Züchtung in der Landwirtschaft.
- 48. Welche Verteilung wurde anfänglich für die Zähldaten der RNA-Sequenzierung verwendet, unterschätzte aber den Messfehler?
A) Poisson-Verteilung B) Normalverteilung C) Binomialverteilung D) Negative Binomialverteilung
- 49. Welche statistischen Modelle werden verwendet, um Tests auf statistische Signifikanz bei der Analyse von RNA-Sequenzierungsdaten durchzuführen?
A) Chi-Quadrat-Tests B) Generalisierte lineare Modelle C) ANOVA (Varianzanalyse) D) Lineare Regressionsmodelle
- 50. Welches Softwarepaket ermöglicht die Schätzung von Varianzkomponenten innerhalb eines allgemeinen linearen gemischten Modells unter Verwendung der REML-Methode?
A) SAS B) ASReml C) Orange D) CycDesigN
- 51. Welche Programmiersprache ist bekannt für ihre Open-Source-Umgebung und ihre Fähigkeiten im Bereich der statistischen Datenverarbeitung, wobei Pakete über CRAN verfügbar sind?
A) SQL B) R C) Python D) MATLAB
- 52. Welche Software unterstützt quantitative Analyseverfahren für regulierte Bereiche wie beispielsweise Arzneimitteltests?
A) SAS B) Apache Spark C) PLA 3.0 D) Weka
- 53. Welche Software ist ein Java-basiertes Werkzeug für maschinelles Lernen und Datenanalyse?
A) R B) Weka C) SAS D) Orange
- 54. Welches Werkzeug wird für die Datenverarbeitung auf hoher Ebene, Data Mining und Visualisierung verwendet?
A) CycDesigN B) ASReml C) PLA 3.0 D) Orange
- 55. Welche Programmiersprache wird im Bereich des Deep Learning und der Bildanalyse in der Bioinformatik eingesetzt?
A) SQL B) Python C) R D) SAS
- 56. Welche Software wird für lineare Algebra-Berechnungen verwendet?
A) SageMath B) LAPACK C) SciPy D) NumPy
- 57. Welcher Cloud-Dienstleister wird als Werkzeug für die statistische Analyse von biologischen Daten genannt?
A) IBM Cloud B) Google Cloud Platform C) Amazon Web Services D) Microsoft Azure
|