Typecraft v2.5
Jump to: navigation, search

Skrivesenter:Annotating chains

--Lars Hellan 18:34, 29 April 2013 (UTC)

Issues concerning the annotation of discourse-related chains can be illustrated with the paragraph below, where I try to annotate chains of MOTIVATION (y happens because of x), and TEMPORAL SEQUENCE (y happens after x). Probably, in both cases, if the text consistently orders (the mention of) x earlier in the text than y, that will feel as better fluency than the opposite, thus these are factors worth annotating for. We have agreed that highlighting chain-types with different colors will be helpful; but to capture what was just said, we in addition must indicate the 'substantial' order (as opposed to textual order) in some fashion. For instance, we can number the items in a given highlight-chain according to the substantial order; whenever that numbering goes against the textual order, we then have a potential non-fluency situation, and a straightforward and easily-tractable representation of it.

Pavel will give us the colors, but for now, I use italics for temporal sequence and boldface for motivational order, and enclose the numbers in '[]'.

The text used is Are Ormberg's rendering of 'Simon's cat'. We go through its sentences in a stepwise fashion; at the end, you see the whole text.


First consider the three first sentences. MotHigh 1 (= 'motivation-chain highlighted item numbered [1]') is the motivational source of MotHigh 2, as we have indicated:

Klippet handler om en katt som ser ut til å være ganske sulten[1],
den finner en flue[2],
som den prøver å spise.

At the same time, it may be reasonable to say that den finner en flue temporally precedes som den prøver å spise; so we should indicate that as well; notice that we keep the numberings apart by using the same highlighting as for the expressions:

Klippet handler om en katt som ser ut til å være ganske sulten[1],
den finner en flue[2; 1],
som den prøver å spise [2].

Here the word may be annotated for its CONSEQUENCE sense in the sentence annotation (whether that can be in some way automatically tied to the paragraph annotation is an interesting question, but not a topic here); if one can drag the table for så den finner en flue in at this point, that would then be excellent.

(Obviously, there is already also quite a bit of co-reference linking, but this editor has no further means of highlighting, so we leave that be...)

Continuing with the next few sentences, we start building up the following:

Klippet handler om en katt som ser ut til å være ganske sulten[1],
den finner en flue[2; 1],
som den prøver å spise [2].


For å gjøre det[2; 2] så må den selvfølgelig drepe den først [1; 1],


This 4th line has a somewhat 'reasoning' structure, where what is both motivationally and temporally preceding is mentioned after the consequent. Devices like for å ... så signal this, so it is not a case of lack of fluency, and the word-level annotation should have a category whereby this is marked.

A further issue arising here is the numbering of line 4 relative to the numbering of the preceding lines. What is numbered temporal '1' in line 4 (the killing) is obviously not the temporal '1' in the upper lines (the finding) - it is later than that, but still before temporal '2' in line 3 (the eating). Let us try to express that:

Klippet handler om en katt som ser ut til å være ganske sulten[1],
den finner en flue[2; 1],
som den prøver å spise [3].
For å gjøre det[2; 3] så må den selvfølgelig drepe den først [1; 2],

For the annotator this is not optimal - she has to backtrack (changing an earlier 2 to 3), to fit an event in between events already time-fixed.

To make this more incremental, one could instead do it as follows:

Klippet handler om en katt som ser ut til å være ganske sulten[1],
den finner en flue[2; 1],
som den prøver å spise [2].
For å gjøre det[2; 2] så må den selvfølgelig drepe den først [1; 2-],


Here the '2-' indicates that this time reference will come in before what has so far been annotated as '2', but the actual editing of this can be done later.

The motivation index in line 4 should perhaps also be adjusted; but perhaps not: in general, temporal precedence is 'transitive', i.e., if x precedes y and y precedes z, then x precedes z; but it is not obvious that if x motivates y and y motivates z, then x motivates z; hence motivational relations maybe should be stated only 'locally', i.e., relative to each sentence. If so, the 'local domains' need to be kept visible throughout the processing of the annotation; that may mean, line breaks must be preserved, but some further device of marking may also be required.

The following lines seem to report on temporal sequence mainly (continuing from the last notation alternative); in this annotation, '3+' means 'in the same sphere of events as 3' - in this report, the exact sequence is not important (and perhaps not even clear):


den jager den rundt i rommet[3] mens den ødelegger en del møbler[3] da,
og velter først en lampe[3+] og knuser et glass[3+] og så videre,
og klatrer opp i gardinene[3+],
som er sånn typisk kattegreie å gjøre hvis de er sultne, selvfølgelig.

The last sentence seems exempted from the temporal chaining, and also from the motivational.

The whole way, temporal particles support the time flow interpretation, as will be encoded in word annotation.

The remainder of the text is:

Og til slutt så klarer den å drepe fluen,
eller den klarer å prøve, ihvertfall, å drepe fluen og slå den bevisstløs,
og etter det her prøver den å vise den døde fluen til eieren sin for å skryte.
Men eieren våkner ikke med en gang, så katten plasserer den døde fluen i munnen til eieren, 
som da våkner av det.
Og eieren er likevel ikke så stolt av hva som har skjedd i rommet da,
og når katten gestikulerer om at det er et eller annet som har blitt spist eller den skal spise
går det opp for eieren at fluen som viste seg å være levende likevel lever i magen hans.:

Some new factors probably lure here; but we have already uncovered a lot of potential complexity, in a very innocently-looking text. Let us see if the annotational strategies suggested may be viable.


The text unmutilated:

Klippet handler om en katt som ser ut til å være ganske sulten, så den finner en flue, som den prøver å spise. For å gjøre det så må den selvfølgelig drepe den først, så den jager den rundt i rommet mens den ødelegger en del møbler da, og velter først en lampe og knuser et glass og så videre, og klatrer opp i gardinene, som er sånn typisk kattegreie å gjøre hvis de er sultne, selvfølgelig. Og til slutt så klarer den å drepe fluen, eller den klarer å prøve, ihvertfall, å drepe fluen og slå den bevisstløs, og etter det her prøver den å vise den døde fluen til eieren sin for å skryte. Men eieren våkner ikke med en gang, så katten plasserer den døde fluen i munnen til eieren, som da våkner av det. Og eieren er likevel ikke så stolt av hva som har skjedd i rommet da, og når katten gestikulerer om at det er et eller annet som har blitt spist eller den skal spise går det opp for eieren at fluen som viste seg å være levende likevel lever i magen hans.


--Lars Hellan 18:34, 29 April 2013 (UTC)