Da’s gaaf!
a. Uniek vocabulaire Ri 4: (de exclusie vocASyr – vocBSyr):
comm -23 vocASyr vocBSyr > uniqASyr
b. Uniek vocabulaire Ri 5: (vocBSyr – VocASyr):
comm -23 vocBSyr vocASyr > uniqBSyr
c. Gemeenschappelijk vocabulaire Ri 4 en 5 (de intersectie / doorsnede van Ri 4 en Ri 5):
comm -12 vocASyr vocBSyr > commABSyr
Als je comm zonder – toevoeging gebruikt is de output een file die de resultaten van a, b en c in drie kolommen naast elkaar zet (in die volgorde):
comm vocASyr vocBSyr > exintABSyr (‘exint’ van ‘exclusion’ en ‘intersection’ – het moet een naam hebben nietwaar?)
Zie voor nadere uitleg de manual page voor comm.
En dan kun je ook nog de vereniging van beide vocabulaires (dus de set van alle lexemen in ons corpus) verkrijgen met:
cat vocASyr vocBSyr | sort -u > unionABSyr