corpora R package [Documentation]

sample_df

Random samples from data frames (corpora)

qw

Split string into words, similar to qw() in Perl (corpora)

rowColVector

Propagate vector to single-row or single-column matrix (corpora)

am_score

Compute association scores for collocation analysis (corpora)

binom_pval

P-values of the binomial test for frequency counts (corpora)

chisq_pval

P-values of Pearson's chi-squared test for frequency comparisons (corp...

chisq

Pearson's chi-squared statistic for frequency comparisons (corpora)

cont_table

Build contingency tables for frequency comparison (corpora)

corpora_package

corpora: Statistical Inference from Corpus Frequency Data

corpora_palette

Colour palettes for linguistic visualization (corpora)

fisher_pval

P-values of Fisher's exact test for frequency comparisons (corpora)

keyness

Compute best-practice keyness measures (corpora)

prop_cint

Confidence interval for proportion based on frequency counts (corpora)

simulated_census

Simulated census data for examples and illustrations (corpora)

simulated_language_course

Simulated study on effectiveness of language course (corpora)

simulated_wikipedia

Simulated type and token counts for Wikipedia articles (corpora)

stars_pval

Show p-values as significance stars (corpora)

z_score_pval

P-values of the z-score test for frequency counts (corpora)

z_score

The z-score statistic for frequency counts (corpora)

Download source package Read PDF manual

Utility functions for the statistical analysis of corpus frequency data. This package is a companion to the open-source course "Statistical Inference: A Gentle Introduction for Computational Linguists and Similar Creatures" ('SIGIL').

Maintainer: Stephanie Evert
License: GPL-3
Last published: 2025-06-10
http://SIGIL.R-Forge.R-Project.org/

corpora0.7 package

Functions

Datasets

Dependencies

Imports

Versions